RigidFormer: 트랜스포머를 이용한 강체 역학 학습

다중 객체 강체(rigid-body) 역학의 학습 기반 시뮬레이션은 접촉이 불연속적이고 시간이 지남에 따라 오차가 누적되기 때문에 여전히 어렵습니다. 기존 방법 대부분은 메시 연결성 및 정점 수준 메시지 전달에 묶여 있어, 포인트 클라우드와 같은 메시 프리(mesh-free) 입력에는 적용하기 어렵고 높은 계산 비용을 초래합니다. 따라서 메시 프리 표현으로부터 고충실도 강체 역학을 효율적으로 모델링하는 것은 여전히 어려운 과제입니다. 본 논문에서는 객체 중심의 트랜스포머 기반 모델인 RigidFormer를 소개하며, 이는 제어 가능한 통합 스텝 크기를 가지는 메시 프리 강체 역학을 학습합니다. RigidFormer는 객체 수준에서 추론하고 압축된 앵커(anchor)를 통해 각 객체를 전진시킵니다. Anchor-Vertex Pooling은 이 앵커들을 국소 정점 특징으로 풍부하게 만들어, 밀집된 정점 수준 상호작용 없이 접촉 관련 기하학을 유지합니다. 우리는 객체와 앵커의 순서가 정해져 있지 않은 특성을 존중하면서 앵커 기하학을 어텐션에 주입하기 위해 Anchor-based RoPE를 제안합니다: 객체 토큰 처리는 순열 등변(permutation-equivariant)이며, 평균 풀링된 앵커 디스크립터는 앵커 재인덱싱에 불변성을 가지면서 형태 범위를 보존합니다. RigidFormer는 또한 미분 가능한 Kabsch 정렬을 사용하여 업데이트를 강체 다양체(rigid-body manifold)로 투영함으로써 강성(rigidity)을 추가적으로 강제합니다.

표준 벤치마크에서 RigidFormer는 포인트 입력을 사용하는 메시 기반 베이스라인을 능가하거나 일치하며, 더 빠르게 실행되고, 보지 못한 포인트 해상도와 데이터셋 전반에 걸쳐 일반화되며, 200개 이상의 객체로 확장됩니다. 또한 본문에서는 신체 부위를 상호 작용하는 객체 수준 구성 요소로 취급하여 명령어 조건부 관절 운동 바디(command-conditioned articulated bodies)로의 예비 확장을 보여줍니다.

Insights

RigidFormer: 트랜스포머를 이용한 강체 역학 학습

요약

핵심 포인트

댓글

Reddit 주가 급락, CEO는 Google 검색 유입이 '불안정'하다고 언급하며 앱 사용 유도

장기 실행 AI 에이전트의 컨텍스트 부채 (Context Debt) 누적 문제

Kevin Warsh 연준 의장은 큰소리를 치고 있지만, 그가 '신뢰성 충격'을 일으킨 후 월스트리트가 그를 신뢰하는지는 이 시장 지표가

2026년 7월 통합 다이제스트 (Integration Digest for July 2026)

장기 실행 AI 에이전트의 컨텍스트 부채 (Context Debt) 누적 문제

Kevin Warsh 연준 의장은 큰소리를 치고 있지만, 그가 '신뢰성 충격'을 일으킨 후 월스트리트가 그를 신뢰하는지는 이 시장 지표가

2026년 7월 통합 다이제스트 (Integration Digest for July 2026)