FACTR 2: 상품 로봇 팔을 위한 외부 힘 감지 학습이 정책 학습 개선에 기여
요약
본 논문은 고가 센서 없이 외부 관절 토크를 추정하는 데이터 기반 방법 NEXT를 제안합니다. 이를 통해 저가형 로봇 팔에서도 힘 피드백 원격 조작이 가능해집니다. 또한, FIRST 기법을 적용하여 행동 복제 과정에서 접촉 전후 데이터를 재샘플링함으로써 정책 학습 성능을 크게 개선했습니다.
핵심 포인트
- NEXT는 별도 센서 없이 외부 관절 토크를 추정하는 데이터 기반 방법입니다.
- 저가형 로봇 팔에서도 힘 피드백 원격 조작이 가능하게 합니다.
- FIRST 기법은 접촉 전후 데이터를 재샘플링하여 정책 학습을 개선합니다.
- 종합적으로 추가 센싱 하드웨어 없이 상용 로봇에 힘 인지 기능을 구현했습니다.
접촉 기반 조작(Contact-rich manipulation)에는 힘 민감도가 요구되지만, 많은 로봇 팔은 고가로 인해 전용 힘 센서를 갖추고 있지 않습니다. 우리는 별도의 전용 힘 센서 없이 외부 관절 토크를 추정하는 데이터 기반 방법인 Neural External Torque Estimation (NEXT)을 제시합니다. NEXT는 단 10분의 자유 동작(free-motion) 데이터만으로 1분 만에 학습하며, 그럼에도 불구하고 전용 관절 토크 센서와 비교할 만한 추정치를 달성합니다. NEXT는 저가형 팔에서 힘 피드백 원격 조작(force-feedback teleoperation)을 가능하게 하며, 행동 복제(behavior cloning) 과정 중 접촉 전 및 접촉 구간을 업샘플링하는 Force-Informed Re-Sampling Training (FIRST)을 통해 정책 학습을 개선합니다. 다섯 가지 장기 지평(long-horizon) 작업에 걸쳐 FIRST는 기존의 힘 인식 정책들보다 작업 진행도에서 17% 이상 우수한 성능을 보입니다. 종합적으로, NEXT와 FIRST는 추가적인 센싱 하드웨어 없이 상용 로봇에 힘 인지 원격 조작과 정책 학습을 구현합니다. 비디오 결과 및 코드는 https://jasonjzliu.com/factr2에서 확인할 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기