
RATs: 로봇이 무엇을 할지 지시받기 전에 학습하도록 가르치는 방법
요약
RATs는 로봇이 명시적인 지시 없이도 자유로운 놀이를 통해 스스로 과업을 생성하고 기술 라이브러리를 구축하도록 학습시키는 방법론입니다. 강화학습 없이도 코드 기반의 정책을 작성하며, 실제 로봇 팔로의 기술 전이 성능이 뛰어납니다.
핵심 포인트
- 자유로운 놀이를 통한 자율적 과업 생성 및 학습
- 강화학습(RL)이나 그래디언트 없이 기술 라이브러리 구축
- Code-as-policy 방식을 통한 재사용 가능한 기술 확보
- 하위 작업 성능 +20.6 pp 향상 및 실제 로봇 전이 성공
RATs는 로봇이 무엇을 할지 지시받기 전에 스스로 학습하도록 가르칩니다.
LLM 에이전트(LLM agents)는 자유로운 놀이(free-form play) 과정에서 스스로 과업을 만들어내고, 정책으로서의 코드(code-as-policy)를 작성하며, 그래디언트(gradients)나 강화학습 (RL) 없이도 재사용 가능한 기술 라이브러리를 구축합니다.
하위 작업(Downstream)에서의 이득은 +20.6 pp에 달하며, 습득한 기술은 실제 Franka 암(arm)으로 전이(transfer)됩니다. https://t.co/aFOYqmXmRj
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기