X요약2026. 06. 20. 07:33

RATs: 로봇이 무엇을 할지 지시받기 전에 학습하도록 가르치는 방법

요약

RATs는 로봇이 명시적인 지시 없이도 자유로운 놀이를 통해 스스로 과업을 생성하고 기술 라이브러리를 구축하도록 학습시키는 방법론입니다. 강화학습 없이도 코드 기반의 정책을 작성하며, 실제 로봇 팔로의 기술 전이 성능이 뛰어납니다.

핵심 포인트

자유로운 놀이를 통한 자율적 과업 생성 및 학습
강화학습(RL)이나 그래디언트 없이 기술 라이브러리 구축
Code-as-policy 방식을 통한 재사용 가능한 기술 확보
하위 작업 성능 +20.6 pp 향상 및 실제 로봇 전이 성공

RATs는 로봇이 무엇을 할지 지시받기 전에 스스로 학습하도록 가르칩니다.

LLM 에이전트(LLM agents)는 자유로운 놀이(free-form play) 과정에서 스스로 과업을 만들어내고, 정책으로서의 코드(code-as-policy)를 작성하며, 그래디언트(gradients)나 강화학습 (RL) 없이도 재사용 가능한 기술 라이브러리를 구축합니다.

하위 작업(Downstream)에서의 이득은 +20.6 pp에 달하며, 습득한 기술은 실제 Franka 암(arm)으로 전이(transfer)됩니다. https://t.co/aFOYqmXmRj

AI 자동 생성 콘텐츠

원문 바로가기

RATs: 로봇이 무엇을 할지 지시받기 전에 학습하도록 가르치는 방법

요약

핵심 포인트

댓글