본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 15. 16:21

Slot-MPC: 객체 중심 표현을 이용한 목표 조건부 모델 예측 제어 (Goal-Conditioned Model Predictive

요약

Slot-MPC는 객체 중심 표현을 활용하여 목표 조건부 모델 예측 제어(Goal-Conditioned Model Predictive Control, MPC)를 가능하게 하는 새로운 프레임워크입니다. 이 방법은 슬롯 기반 표현을 학습하여 개별 객체를 인코딩하고, 이를 통해 행동 조건부 객체 중심 역학 모델을 구축합니다. Slot-MPC는 MPC를 사용하여 에이전트가 이전에 경험하지 못한 상황에서도 일반화된 행동 계획을 수행할 수 있게 하며, 특히 그래디언트 기반 MPC를 활용하여 계산 효율성을 높였습니다.

핵심 포인트

  • Slot-MPC는 객체 중심 표현(object-centric representations)을 이용해 장면 역학을 모델링합니다.
  • 슬롯 기반 표현(slot-based representations)을 학습하여 개별 객체를 구조화된 방식으로 인코딩합니다.
  • 모델 예측 제어(MPC)를 적용함으로써 에이전트가 새로운 상황에 대한 일반화된 행동 계획을 수행할 수 있습니다.
  • 그래디언트 기반 MPC를 사용하여 계산 효율성을 높이고, 직접적인 행동 최적화를 가능하게 합니다.
  • 실험 결과, Slot-MPC는 로봇 조작 작업에서 높은 성능과 계획 효율성 향상을 입증했습니다.

예측적 월드 모델 (Predictive world models)은 에이전트가 장면의 역학 (scene dynamics)을 모델링하고 자신의 행동에 따른 결과를 추론할 수 있게 합니다. 인간의 지각에서 영감을 받은 객체 중심 월드 모델 (object-centric world models)은 객체 수준의 표현 (object-level representations)을 사용하여 장면의 역학을 포착하며, 이는 행동 계획 (action planning)과 같은 다운스트림 애플리케이션에 사용될 수 있습니다. 그러나 대부분의 객체 중심 월드 모델과 강화학습 (RL) 접근 방식은 추론 시점에 고정되는 반응형 정책 (reactive policies)을 학습하며, 이는 새로운 상황에 대한 일반화 (generalization)를 제한합니다. 우리는 모델 예측 제어 (Model Predictive Control, MPC)를 통해 계획을 가능하게 하는 객체 중심 월드 모델링 프레임워크인 Slot-MPC를 제안합니다. Slot-MPC는 비전 인코더 (vision encoders)를 활용하여 장면 내의 개별 객체를 인코딩하는 슬롯 기반 표현 (slot-based representations)을 학습하며, 이러한 구조화된 표현을 사용하여 행동 조건부 객체 중심 역학 모델 (action-conditioned object-centric dynamics model)을 학습합니다. 추론 시점에 학습된 역학 모델은 MPC를 통한 행동 계획을 가능하게 하여, 에이전트가 이전에 보지 못한 상황에 적응할 수 있도록 합니다. 학습된 월드 모델은 미분 가능 (differentiable)하므로, 그래디언트 기반 MPC (gradient-based MPC)를 사용하여 행동을 직접 최적화할 수 있으며, 이는 그래디언트 프리 샘플링 기반 MPC (gradient-free, sampling-based MPC) 방법에 의존하는 것보다 계산적으로 더 효율적입니다. 시뮬레이션된 로봇 조작 (robotic manipulation) 작업에 대한 실험 결과, Slot-MPC는 비객체 중심 월드 모델 베이스라인과 비교하여 작업 성능과 계획 효율성을 모두 향상시키는 것으로 나타났습니다. 상태-행동 커버리지가 제한된 고려된 오프라인 설정에서, 우리는 그래디언트 기반 MPC가 그래디언트 프리 샘플링 기반 MPC보다 더 나은 성능을 보임을 확인했습니다. 우리의 결과는 명시적으로 구조화된 객체 중심 표현이 제어 가능하고 일반화 가능한 의사결정을 위한 강력한 귀납적 편향 (inductive bias)을 제공한다는 것을 입증합니다. 코드와 추가 결과는 https://slot-mpc.github.io 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0