AdaJEPA: 적응형 잠재 세계 모델 (An Adaptive Latent World Model)
요약
AdaJEPA는 테스트 시점의 분포 변화에 대응하기 위해 모델 예측 제어(MPC) 내에서 테스트 시점 적응을 수행하는 적응형 잠재 세계 모델입니다. 자기 지도 학습 신호를 활용해 추가적인 전문가 데이터 없이도 모델을 지속적으로 재보정하여 계획 성공률을 높입니다.
핵심 포인트
- 테스트 시점의 분포 변화에 대응하는 적응형 잠재 세계 모델 제안
- MPC 폐루프 내에서 자기 지도 적응 신호를 통한 모델 업데이트
- 추가적인 전문가 시연 없이도 모델의 지속적인 재보정 가능
- 단 한 번의 경사 하강 단계만으로도 목표 도달 성공률 향상
잠재 세계 모델 (Latent world models)은 압축된 잠재 공간 (latent space)에서 미래 상태를 예측함으로써 고차원 관측값으로부터 계획 (planning)을 가능하게 합니다. 그러나 이러한 모델들은 일반적으로 테스트 시점에 동결 (frozen)된 상태로 유지됩니다. 즉, 예측이 부정확해질 경우, 특히 테스트 시점의 분포 변화 (test-time distribution shift) 상황에서 계획이 실패할 수 있습니다. 이를 해결하기 위해, 우리는 모델 예측 제어 (MPC)의 폐루프 (closed loop) 내에서 테스트 시점 적응 (test-time adaptation)을 수행하는 적응형 잠재 세계 모델인 AdaJEPA를 제안합니다. 학습 후, AdaJEPA는 계획을 세우고 첫 번째 액션 청크 (action chunk)를 실행하며, 관측된 다음 상태 전이 (next-state transition)를 자기 지도 적응 신호 (self-supervised adaptation signal)로 사용하여 업데이트된 모델로 다시 계획 (replanning)을 수행합니다. 이러한 폐루프 업데이트는 추가적인 전문가 시연 (expert demonstrations) 없이도 세계 모델을 지속적으로 재보정 (recalibrate)합니다. 다양한 목표 도달 작업 (goal-reaching tasks)에 걸쳐, AdaJEPA는 MPC 재계획 단계당 단 한 번의 경사 하강 단계 (gradient step)만으로도 계획 성공률을 실질적으로 향상시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기