arXiv논문2026. 05. 21. 11:52

roto 2.0: 로봇 촉각 올림피아드

요약

roto 2.0은 파편화된 촉각 기반 강화학습(RL) 연구를 표준화하기 위해 설계된 GPU 병렬화 벤치마크입니다. 고유 수용 감각과 촉각 센싱만을 사용하는 '맹목적(blind)' 조작에 집중하며, 기존 SOTA 대비 압도적인 성능 향상을 입증했습니다. 오픈 소스 환경과 베이스라인을 제공하여 연구자들이 알고리즘 자체에 집중할 수 있도록 돕습니다.

핵심 포인트

네 가지 서로 다른 로봇 형태(16-DOF~24-DOF)를 지원하는 GPU 병렬화 벤치마크 도입
상태 정보나 증류 없이 고유 수용 감각과 촉각 센싱만 활용하는 엔드투엔드 방식 지향
바오딩 공 회전 작업에서 기존 최첨단(SOTA) 기술보다 한 자릿수 빠른 성능 달성
오픈 소스 환경 및 튜닝된 베이스라인 제공을 통한 연구 진입 장벽 완화

촉각 기반 강화학습 (RL)은 현재 파편화된 연구와 과포화된 방향성 작업에 치중된 연구 집중 문제로 인해 어려움을 겪고 있습니다. 우리는 네 가지 서로 다른 로봇 형태 (16-DOF에서 24-DOF)에 걸쳐 촉각 기반 RL을 표준화하기 위해 설계된 GPU 병렬화 벤치마크인 Robot Tactile Olympiad의 버전 2 ( exttt{roto 2.0})를 소개합니다. 이전의 벤치마크들과 달리, roto는 상태 정보 (state information)나 증류 (distillation) 없이 고유 수용 감각 (proprioception)과 촉각 센싱 (tactile sensing)만을 활용하는 엔드투엔드 (end-to-end) "맹목적 (blind)" 조작에 집중합니다. 우리는 우리의 맹목적 에이전트가 10초 안에 13번의 바오딩 공 (Baoding ball) 회전을 달성하며, 이는 현재의 최첨단 (state-of-the-art) 속도보다 한 자릿수 더 빠른 유의미한 성능 도약을 보여줌을 입증했습니다. 환경을 오픈 소스로 공개하고 견고하게 튜닝된 베이스라인 (baselines)을 제공함으로써, 우리는 진입 장벽을 낮추고 연구자들이 지루한 RL 튜닝 대신 근본적인 알고리즘 과제에 우선순위를 둘 수 있도록 합니다. 웹사이트: https://elle-miller.github.io/roto/

AI 자동 생성 콘텐츠

원문 바로가기

roto 2.0: 로봇 촉각 올림피아드

요약

핵심 포인트

댓글