ORCA: 오픈 소스 숙련도(Dexterity) 연구를 위한 플랫폼
요약
로봇의 숙련된 조작(Dexterity) 연구를 지원하기 위한 오픈 소스 학습 스택인 ORCA를 소개합니다. 제어, 시뮬레이션, 원격 조작 및 리타겟팅을 단일 인터페이스로 통합하여 연구 효율성을 높였습니다.
핵심 포인트
- 다양한 소비자용 플랫폼을 위한 통합 인터페이스 제공
- lerobot 등 기존 로봇 학습 프레임워크와 네이티브 통합
- VR 헤드셋을 활용한 전문가 시연 데이터 수집 워크플로우 입증
- 재현 가능한 엔드 투 엔드 로봇 학습 파이프라인 구축
로봇 조작(Robotics manipulation) 연구는 그 효과성, 저렴한 비용, 그리고 원격 조작(Teleoperation)의 용이성 덕분에 두 손가락 평행 그리퍼(Two-finger parallel grippers)에 점점 더 집중하고 있습니다. 그럼에도 불구하고 그리퍼는 그 형태적 요인(Form factor)으로 인해 제한이 있으며, 단순한 재배향(Reorientation) 작업조차도 종종 양손(Bimanual) 설정을 필요로 합니다. 인간형 손(Anthropomorphic hands)은 인간의 손과 더 유사하고 인간의 비디오로부터 학습할 수 있어, 숙련된 로봇 학습(Dexterous robot learning)을 위한 더 자연스러운 플랫폼이지만, 학습 연구에서 사용하기에는 여전히 어렵습니다. 개방적이고 접근 가능한 핸드 하드웨어가 존재하는 경우에도, 제어(Control), 시뮬레이션(Simulation), 원격 조작(Teleoperation), 그리고 리타겟팅(Retargeting)을 위한 소프트웨어가 일회성 코드베이스로 흩어져 있으며, 로봇 학습 생태계와는 대체로 단절되어 있습니다.
본 연구에서는 숙련도(Dexterity)를 일급 로봇 학습 도메인(First-class robot learning domain)으로 다루기 위한 오픈 소스 연구 스택인 ext{orca} 학습 스택(learning stack)을 소개합니다. 우리의 ext{orca} 스택은 다양한 소비자용 플랫폼으로부터의 저수준 제어(Low-level control), 시뮬레이션, 원격 조작, 그리고 핸드 리타겟팅(Hand retargeting)을 단일 인터페이스 뒤로 통합하며, ext{lerobot}과 같은 인기 있는 로봇 학습 프레임워크와 네이티브하게 통합됩니다. 이를 통해 숙련된 손 연구자들은 비숙련 로봇 학습에 사용되는 것과 동일한 데이터, 학습 및 평가 파이프라인을 활용할 수 있습니다. 우리는 소비자용 VR 헤드셋을 이용한 원격 조작을 통해 손 안의 재배향(In-hand reorientation) 작업에 대한 전문가 시연(Expert demonstrations)을 수집하고, ext{lerobot}으로 자율 정책(Autonomous policy)을 학습시키며, 완전히 재현 가능하고 관찰 가능한 설정에서 학습된 정책을 평가하는 완전한 엔드 투 엔드(End-to-end) 워크플로우를 입증합니다. 우리는 숙련된 조작(Dexterous-manipulation) 연구를 위한 공유되고 재현 가능한 기반으로서 전체 스택을 오픈 소스로 공개합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기