Embodied Intelligence 를 위한 일반 동작 인코더의 'ImageNet' 벤치마크인 LARY 소개
요약
본 기사는 신체 지능(Embodied Intelligence) 분야에서 일반적인 동작 인코더를 평가하기 위한 새로운 벤치마크, LARY를 소개합니다. LARY는 잠재적 동작 표현을 동작 일반화와 로봇 제어라는 두 가지 측면에서 정량적으로 평가할 수 있는 최초의 방법입니다. 이 벤치마크는 인간 동작 비디오와 같은 확장 가능한 데이터 소스를 활용하여 모델의 성능을 검증하는 데 중점을 둡니다.
핵심 포인트
- LARY는 일반적인 동작 인코더를 위한 'ImageNet'과 같은 역할을 하는 새로운 벤치마크입니다.
- 이 벤치마크는 잠재적 동작 표현(Latent Action Representation)을 평가합니다.
- 평가 기준은 동작 일반화(action generalization)와 로봇 제어(robotic control) 두 가지 측면에서 정량적으로 이루어집니다.
- 인간 동작 비디오를 확장 가능한 데이터 소스로 활용하여 모델의 성능 검증에 용이합니다.
우리는 Embodied Intelligence(신체 지능) 분야에서 일반적인 동작 인코더 (general action encoder) 에 대한 "ImageNet" 벤치마크인 LARY 를 소개합니다. 이는 잠재적 동작 표현 (Latent Action Representation) 을 동작 일반화 (action generalization) 와 로봇 제어 (robotic control) 양쪽에서 정량적으로 평가하는 최초의 방법입니다.
인간 동작 비디오는 확장 가능한 데이터 소스를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @_akhaliq (AI 논문)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기