CHORUS: 단일 VLA 정책을 이용한 분산형 다중 체현 협업
요약
CHORUS는 단일 VLA 백본을 활용하여 분산형 다중 로봇 팀 제어에 적응시키는 프레임워크입니다. 이 방법은 각 로봇이 자신의 국부적 관측치와 식별 프롬프트만으로 반응적인 협업을 가능하게 합니다. 실험 결과, CHORUS는 기존의 중앙 집중식 및 분산형 모델 대비 높은 성능 향상을 입증했습니다.
핵심 포인트
- 단일 VLA 백본 기반의 분산형 다중 로봇 제어 프레임워크 제시
- 로봇별 국부 관측치와 식별 프롬프트만으로 협업 가능
- 기존 방법론 대비 높은 반응성과 성능 향상 입증
다중 로봇 협업은 소파를 문을 통과시키는 것부터 건설 현장에서 구조물을 조립하는 것까지 광범위한 작업을 효율적으로 수행할 수 있게 합니다. 하지만 이동식 다중 로봇 환경에서 그러한 조정(coordination)을 달성하는 것은 여전히 어렵습니다. 팀의 결합된 관측치에 의존하는 중앙 집중식 방법은 팀 크기에 따라 성능이 급격히 저하되며, 로봇당 하나의 정책을 학습시키는 분산형 방법은 부분적 가시성(partial observability)을 극복하기 위해 추론 시간(inference time)에 명시적인 정렬 절차나 정보 공유를 필요로 하는 경우가 많습니다. 우리의 핵심 통찰은 사전 훈련된 비전-언어-행동(VLA) 모델의 시각 운동적 선험지식(visuomotor priors)이 이러한 추론 시간 가정이 없이도 각 로봇의 국부적인 관측치만으로 반응적이고 분산된 협업을 가능하게 해야 한다는 것입니다. 우리는 단일 VLA 백본을 다양한 다중 로봇 팀 제어에 적응시키는 프레임워크인 CHORUS를 제안합니다. 추론 시간 동안, 각 로봇은 오직 자신의 관측치와 로봇 식별 프롬프트(robot-identifying prompt)에만 조건화되어 CHORUS의 독립적인 사본을 실행합니다. 이동식 테이프 측정, 도서관 책 전달, 세탁 바구니 들기 등을 포함한 실제 환경 실험에서, CHORUS는 분산형으로 처음부터 구축된 모델 대비 64% 포인트 향상을 달성하고, 팀원 행동에 대한 반응성을 40% 포인트 개선하며, 중앙 집중식 기준선(baseline)을 능가합니다. 종합적으로 볼 때, 이러한 결과들은 공유 VLA 백본이 추론 시 로봇별 정책이나 로봇 간 통신 없이도 분산형 다중 로봇 협업을 달성할 수 있음을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기