미분 가능한 관절 추론 및 에너지 일관성 검증을 통한 RGB-D 시퀀스로부터의 URDF 합성
요약
KinemaForge는 RGB-D 시퀀스를 활용해 관절이 있는 객체의 형상, 토폴로지, 파라미터를 동시에 추론하는 새로운 파이프라인을 제안합니다. 미분 가능한 강체 역학을 통해 에너지 일관성을 검증함으로써 물리 시뮬레이션 시 발생하는 드리프트 문제를 획기적으로 개선했습니다.
핵심 포인트
- RGB-D 데이터를 통한 부품 수준의 기하학적 재구성 및 관절 파라미터 공동 추론
- 미분 가능한 스크류 축 솔버를 통한 정밀한 관절 축 추정
- 에너지 잔차 손실을 도입하여 물리적 불변성을 유지하는 URDF 생성
- 기존 베이스라인 대비 관절 축 오차 및 시뮬레이션 드리프트 대폭 감소
센서 관측으로부터 관절이 있는 객체(articulated objects)의 시뮬레이션 준비가 된 디지털 트윈을 재구성하는 것은 두 가지 지속적인 격차로 인해 제약을 받고 있습니다: (i) 부품 수준의 기하학적 재구성(geometric reconstruction)이 운동학적 파라미터(kinematic-parameter) 추정과 분리되어 있다는 점, 그리고 (ii) 복구된 모델이 에너지 보존과 같은 기본적인 동적 불변량(dynamic invariants)을 위반하는 경우가 많아, URDF를 물리 시뮬레이터에서 재생할 때 드리프트(drift)가 발생한다는 점입니다. 우리는 짧은 RGB-D 시퀀스로부터 부품 수준의 형상, 관절 토폴로지(joint topology), 관절 파라미터를 공동으로 추론하고, 미분 가능한 강체 역학(differentiable rigid-body dynamics)을 기반으로 구축된 에너지 일관성 검증기(energy-consistent verifier)를 통해 결과를 검증하는 제약 조건 기반 파이프라인인 KinemaForge를 제시합니다. 이 파이프라인은 세 가지 구성 요소를 도입합니다: 관절-부품 인시던스(joint-part incidences)를 소프트 엣지(soft edges)로 인코딩하는 운동학적 제약 그래프(kinematic constraint graph); 렌더링된 관측치로부터 Featherstone의 관절체 알고리즘(articulated-body algorithm)을 통해 관절 파라미터로 역전파되는 미분 가능한 스크류 축 솔버(differentiable screw-axis solver); 그리고 재구성된 모델의 비물리적인 자유 응답(non-physical free responses)에 패널티를 부여하는 에너지 잔차 손실(energy residual loss)입니다. 5개의 PartNet-Mobility 카테고리와 내부 RGB-D 벤치마크 전반에 걸쳐, KinemaForge는 가장 강력한 기하학적 베이스라인인 PARIS 대비 평균 관절 축 오차를 4.52도에서 2.83도(-37.4%)로 줄였고, 상호작용 기반인 Ditto 베이스라인 대비 5.30도에서 2.83도(-46.6%)로 줄였으며, 50초 롤아웃(rollouts) 동안 장기 시뮬레이션 드리프트(long-horizon simulation drift)를 64%(vs. PARIS) 낮추었으며, 예비 평가에서 Ditto 대비 폐루프 조작(closed-loop manipulation) 성공률을 14.6%포인트 향상시킨 URDF를 생성했습니다. 코드와 재구성 데이터는 승인 시 공개될 예정입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기