RigidFormer: 트랜스포머를 이용한 강체 역학 학습
요약
RigidFormer는 다중 객체 강체 역학 시뮬레이션의 어려움(불연속적 접촉, 오차 누적 등)을 해결하기 위해 제안된 트랜스포머 기반 모델입니다. 이 모델은 메시 프리 표현으로부터 고충실도 강체 역학을 효율적으로 학습하며, 객체 수준에서 추론하고 압축된 앵커를 통해 각 객체를 전진시킵니다. 특히 Anchor-based RoPE와 미분 가능한 Kabsch 정렬을 사용하여 기하학적 일관성과 강성을 유지하면서 높은 성능과 일반화 능력을 보여줍니다.
핵심 포인트
- RigidFormer는 메시 프리(mesh-free) 표현을 활용하여 다중 객체 강체 역학 시뮬레이션을 수행합니다.
- 객체 수준 추론 및 압축된 앵커를 사용하여 계산 효율성을 높이고, 접촉 관련 기하학적 정보를 유지합니다.
- Anchor-based RoPE와 미분 가능한 Kabsch 정렬을 도입하여 순열 등변성(permutation-equivariance)과 강성(rigidity) 제약을 효과적으로 적용했습니다.
- 기존 메시 기반 방법론 대비 높은 성능, 빠른 실행 속도, 그리고 넓은 일반화 능력을 입증했습니다.
다중 객체 강체(rigid-body) 역학의 학습 기반 시뮬레이션은 접촉이 불연속적이고 시간이 지남에 따라 오차가 누적되기 때문에 여전히 어렵습니다. 기존 방법 대부분은 메시 연결성 및 정점 수준 메시지 전달에 묶여 있어, 포인트 클라우드와 같은 메시 프리(mesh-free) 입력에는 적용하기 어렵고 높은 계산 비용을 초래합니다. 따라서 메시 프리 표현으로부터 고충실도 강체 역학을 효율적으로 모델링하는 것은 여전히 어려운 과제입니다. 본 논문에서는 객체 중심의 트랜스포머 기반 모델인 RigidFormer를 소개하며, 이는 제어 가능한 통합 스텝 크기를 가지는 메시 프리 강체 역학을 학습합니다. RigidFormer는 객체 수준에서 추론하고 압축된 앵커(anchor)를 통해 각 객체를 전진시킵니다. Anchor-Vertex Pooling은 이 앵커들을 국소 정점 특징으로 풍부하게 만들어, 밀집된 정점 수준 상호작용 없이 접촉 관련 기하학을 유지합니다. 우리는 객체와 앵커의 순서가 정해져 있지 않은 특성을 존중하면서 앵커 기하학을 어텐션에 주입하기 위해 Anchor-based RoPE를 제안합니다: 객체 토큰 처리는 순열 등변(permutation-equivariant)이며, 평균 풀링된 앵커 디스크립터는 앵커 재인덱싱에 불변성을 가지면서 형태 범위를 보존합니다. RigidFormer는 또한 미분 가능한 Kabsch 정렬을 사용하여 업데이트를 강체 다양체(rigid-body manifold)로 투영함으로써 강성(rigidity)을 추가적으로 강제합니다.
표준 벤치마크에서 RigidFormer는 포인트 입력을 사용하는 메시 기반 베이스라인을 능가하거나 일치하며, 더 빠르게 실행되고, 보지 못한 포인트 해상도와 데이터셋 전반에 걸쳐 일반화되며, 200개 이상의 객체로 확장됩니다. 또한 본문에서는 신체 부위를 상호 작용하는 객체 수준 구성 요소로 취급하여 명령어 조건부 관절 운동 바디(command-conditioned articulated bodies)로의 예비 확장을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기