ATLAS: 장기 범위의 로봇 행동 분할을 위한 주석 도구
요약
ATLAS는 장기 범위 로봇 행동 분할을 위해 설계된 전문 주석 도구입니다. 이 도구는 다중 모달 데이터를 시간 동기화하여 시각화하며, 비전 데이터뿐만 아니라 그리퍼 상태나 힘/토크 같은 고유수용성 신호도 통합적으로 처리합니다. ATLAS는 ROS bags 및 RLDS와 같은 표준 로봇공학 데이터셋 형식을 기본 지원하고, 효율적인 키보드 중심 인터페이스를 통해 주석 작업의 시간과 정확도를 크게 향상시킵니다.
핵심 포인트
- ATLAS는 다중 모달(비전 + 고유수용성 신호) 데이터를 통합적으로 처리하여 로봇 행동 분할을 위한 전용 주석 도구입니다.
- ROS bags 및 RLDS와 같은 표준 로봇공학 데이터셋 형식을 기본 지원하며, 확장성이 뛰어납니다.
- 키보드 중심의 인터페이스를 통해 주석 작업 효율성을 높이고, 기존 도구 대비 시간 절약 및 경계 오차 감소 효과를 입증했습니다.
- 다중 시계열 신호의 포함은 전문가 주석과의 시간 정렬을 개선하고 행동 분할의 정확도를 크게 향상시킵니다.
정확한 시간적 행동 경계를 가진 장기 범위의 로봇 시연 데이터를 주석 처리하는 것은 행동 분할 및 조작 정책 학습 방법의 훈련과 평가에 필수적입니다. 그러나 기존 주석 도구는 종종 제한적입니다: 이들은 주로 비전 (vision) 데이터만을 위해 설계되었으며, 로봇 고유의 시계열 신호 (예: 그리퍼 상태 또는 힘/토크) 의 동기화된 시각화를 기본적으로 지원하지 않거나, 다양한 데이터셋 형식에 적응하는 데 상당한 노력이 필요합니다. 본 논문에서는 장기 범위의 로봇 행동 분할을 위한 전용 주석 도구인 ATLAS 를 소개합니다. ATLAS 는 다중 뷰 비디오와 고유수용성 신호 (proprioceptive signals) 와 같은 다중 모달 로봇 데이터를 시간 동기화하여 시각화하며, 행동 경계, 행동 레이블, 작업 결과의 주석을 지원합니다. 이 도구는 ROS bags 와 강화학습 데이터셋 (RLDS) 형식과 같이 널리 사용되는 로봇공학 데이터셋 형식을 기본적으로 처리하며, REASSEMBLE 과 같은 특정 데이터셋에 대한 직접적인 지원을 제공합니다. ATLAS 는 모듈형 데이터셋 추상화 계층을 통해 새로운 형식으로 쉽게 확장할 수 있습니다. 키보드 중심의 인터페이스는 주석 작업 노력을 최소화하고 효율성을 향상시킵니다. 접촉이 풍부한 조립 작업에 대한 실험에서 ATLAS 는 ELAN 에 비해 평균 행동당 주석 처리 시간을 최소 6% 줄였으며, 시계열 데이터의 포함은 전문가 주석과의 시간 정렬을 2.8% 이상 개선하고 비전 전용 주석 도구 대비 경계 오차를 5 배 감소시켰습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기