GPC: 전이 가능한 모터 제어를 위한 대규모 생성적 사전 학습 (Large-Scale Generative Pretraining for
요약
GPC는 토큰화와 다음 토큰 예측 기술을 활용하여 물리 기반 캐릭터 애니메이션을 위한 범용 생성적 제어기를 구축하는 연구입니다. FSQ를 통해 동작 어휘를 모델링하고 GPT 스타일의 트랜스포머로 제어 신호를 생성하여 높은 재현율과 창발적 행동을 보여줍니다.
핵심 포인트
- 토큰화 및 다음 토큰 예측을 활용한 생성적 제어기 프레임워크 제안
- FSQ를 통한 동작 어휘 모델링 및 자기회귀 트랜스포머 학습
- 방대한 동작 클립 재현 시 99.98%의 높은 성공률 달성
- 섭동 대응 및 회복 동작 등 자연스러운 창발적 행동 구현
물리 기반 캐릭터 애니메이션 (physics-based character animation)의 실질적인 응용을 가능하게 하는 핵심 과제는 자연스럽고 생동감 넘치는 방식으로 광범위한 작업을 수행할 수 있는 제어기 (controllers)를 개발하는 것입니다. 본 연구에서는 토큰화 (tokenization)와 다음 토큰 예측 (next-token modeling)을 활용하여 대규모 동작 데이터셋으로부터 범용적이고 재사용 가능한 생성적 제어기 (generative controllers)를 구축하는 GPC (Generative Pretrained Controllers)를 소개합니다. 우리의 프레임워크는 종단간 강화학습 (end-to-end reinforcement learning)을 사용하여, 유한 스칼라 양자화 (Finite Scalar Quantization, FSQ)를 통해 모델링된 "동작 어휘 (motion vocabulary)"와 이 이산 코드 (discrete codes)를 물리 기반 제어 (physics-based controls)로 매핑할 수 있는 대응 제어 정책 (control policy)을 공동으로 최적화합니다. "코드북 (codebook)" 학습이 완료된 후, 이 대규모 어휘의 기저 구조는 GPT 스타일의 자기회귀 트랜스포머 (autoregressive transformer)를 학습함으로써 모델링되며, 이는 다음 토큰 예측 (next-token prediction)을 수행함으로써 물리적으로 시뮬레이션된 캐릭터를 위한 제어 신호를 생성하는 강력한 생성적 제어기로 이어집니다. 생성적 제어기가 학습된 후, 우리는 새로운 다운스트림 작업 (downstream tasks)에 대해 제어기를 미세 조정 (finetuning)하기 위한 일련의 적응 기술 (adaptation techniques)을 제안합니다. 우리가 제안하는 프레임워크는 이전의 토큰화된 방식들에 비해 학습 과정을 크게 단순화하며, 방대한 동작 클립 코퍼스 (corpus of motion clips)를 재현하는 데 있어 99.98%의 성공률을 달성합니다. 이 생성적 제어기는 섭동 (perturbations)에 대한 반응적 동작 및 넘어짐 이후의 회복 동작과 같은 다양한 자연스러운 창발적 행동 (emergent behaviors)을 보여줍니다. 이는 다양한 다운스트림 응용 분야를 위한 매우 강력하고 범용적인 제어기를 결과로 도출합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기