본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 30. 13:56

ReactiveBFM: 범용 휴머노이드 전신 제어를 향한 반응형 폐루프 동작 계획 (Reactive Closed-Loop Motion

요약

ReactiveBFM은 휴머노이드의 반응형 전신 제어를 위한 실시간 폐루프 동작 계획 프레임워크입니다. 노출 편향을 완화하는 샘플링 커리큘럼과 비동기 재계획 메커니즘을 통해 환경 변화에 유연하게 대응하며, Unitree G1 로봇에서 높은 물리적 민첩성을 입증했습니다.

핵심 포인트

  • 노출 편향 완화를 위한 스케줄링된 접두사 샘플링 커리큘럼 도입
  • 비동기 재계획 메커니즘으로 계획과 제어 간 지연 시간 불일치 해결
  • 궤적 청킹 기술을 통한 물리적 떨림 없는 시공간적 유연성 확보
  • Unitree G1 로봇에서 제로샷 이동 목표 도달 및 높은 성공률 달성

현재의 행동 파운데이션 모델 (Behavior Foundation Models (BFMs))은 휴머노이드에 대한 강력한 제어 사전 정보 (priors)를 제공하지만, 사전에 정의된 참조 동작 (reference motions)만을 실행합니다. 그 결과, 환경 변화에 취약하며 반응형 전신 협응 (reactive whole-body coordination)이 불가능합니다. 이를 생성형 동작 계획기 (generative motion planners)와 단순히 직렬로 연결하는 방식은 진정한 반응성을 달성하는 데 실패하는데, 이는 피할 수 없는 추적 오차 (tracking discrepancies)가 치명적인 누적 노출 편향 (cumulative exposure bias)을 유발하기 때문입니다.

이러한 격차를 해소하기 위해, 우리는 실시간 폐루프 계획-제어 프레임워크인 ReactiveBFM을 제안합니다. 핵심적으로, 우리는 스케줄링된 접두사 샘플링 커리큘럼 (scheduled prefix sampling curriculum)을 통해 노출 편향 (exposure bias)을 효과적으로 완화하며, 이를 통해 생성형 계획기가 정답 궤적 (ground-truth trajectories) 대신 불완전한 물리적 상태로부터 오류 복구 동작 (error-recovery behaviors)을 능동적으로 학습하도록 강제합니다. 체계적으로는, 자기회귀 계획 (auto-regressive planning)과 고주파 추적 (high-frequency tracking) 사이의 심각한 지연 시간 불일치 (latency mismatch)를 조정하기 위해 비동기 재계획 (asynchronous replanning) 메커니즘을 도입합니다. 공간적 참조를 시간적으로 앙상블하는 궤적 청킹 (trajectory chunking)과 결합하여, 우리 시스템은 물리적 떨림 (physical jitter) 없이 시공간적으로 유연한 실행을 보장합니다.

Unitree G1 휴머노이드에 배포된 ReactiveBFM은 텍스트 조건부 폐루프 동작 (text-conditioned closed-loop motions)의 방대한 레퍼토리 전반에 걸쳐 전례 없는 물리적 민첩성을 입증합니다. 특히, ReactiveBFM은 제로샷 이동 목표 도달 (zero-shot moving target reaching)을 달성하여 복잡한 전신 협응과 즉각적인 재계획 (on-the-fly replanning) 능력을 보여줍니다. 심각한 섭동 (perturbations) 하에서의 sim-to-sim 벤치마킹에서 ReactiveBFM은 93.1%의 성공률을 달성하였으며, 이는 직렬 연결된 개방 루프 (open-loop) 베이스라인보다 28.6%나 크게 상회하는 수치입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0