
Humanoid-GPT
요약
20억 개의 모션 프레임을 학습한 GPT 스타일의 트랜스포머 모델로, 제로샷 휴머노이드 제어를 가능하게 합니다. 별도의 미세 조정 없이도 G1 로봇이 축구, 춤 등 역동적인 동작을 수행할 수 있는 일반화 능력을 보여줍니다.
핵심 포인트
- 20억 개의 모션 프레임을 활용한 대규모 학습
- 제로샷 제어를 통한 민첩성과 일반화 성능 동시 확보
- G1 로봇을 활용한 축구, 춤 등 역동적 작업 수행 가능
- 별도의 미세 조정(fine-tuning)이 필요 없는 범용성
Humanoid-GPT
제로샷 (zero-shot) 휴머노이드 제어를 위해 20억 개의 모션 프레임 (motion frames)으로 학습된 GPT 스타일의 트랜스포머 (Transformer) 모델입니다. 이 모델은 민첩성(agility)과 일반화(generalization) 사이의 상충 관계(trade-off)를 깨뜨려, 별도의 미세 조정 (fine-tuning) 없이도 실제 G1 로봇에서 축구, 춤, 땅 파기와 같은 역동적인 작업을 수행할 수 있게 합니다.
논문 (Paper):
https://huggingface.co/papers/2606.03985
…
프로젝트 페이지 (Project page):
https://qizekun.github.io/Humanoid-GPT/
코드 (Code):
https://github.com/GalaxyGeneralRobotics/Humanoid-GPT
…
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기