본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 18. 11:45

부분 관측 가능 환경에서의 내비게이션을 위한 생성 모델 기반 예측 계획 (Generative-Model Predictive Planning)

요약

부분 관측 가능 환경에서 자율 에이전트의 내비게이션 성능을 높이기 위한 새로운 프레임워크 BeliefDiffusion을 제안합니다. 확산 모델을 통해 다중 모드 신념 분포를 포착하고 모델 예측 제어(MPC)를 결합하여 효율적인 경로 계획을 수행합니다.

핵심 포인트

  • 확산 모델을 활용하여 복잡한 환경의 다중 모드 신념 분포를 명시적으로 특징화함
  • 생성 모델의 상상 능력과 MPC의 계획 능력을 결합한 프레임워크 제안
  • 관측 이력을 기반으로 환경 구성을 상상하고 이에 대한 내비게이션 전략을 수립
  • 기존 강화학습 및 생성적 접근 방식보다 높은 내비게이션 성공률과 효율성 입증

부분 관측 가능 환경 (Partially Observable Environments)에서의 내비게이션은 자율 에이전트에게 상당한 도전 과제를 제시하며, 미지의 환경에서 제한된 감각 정보만으로 효과적인 의사결정을 내릴 것을 요구합니다. 신념 기반 방법론 (Belief-based methods), 특히 신념 공간 (Belief space)을 근사하기 위해 신경망을 사용하는 방법들은 지각적 모호성 (Perceptual aliasing)이 존재하는 고차원 사례에서 신념 공간의 내재적인 다중 모드성 (Multimodality)을 포착하는 데 종종 실패합니다. 생성 모델 (Generative models)이 매력적인 대안을 제시하기는 하지만, 일반적으로 상당한 데이터나 전문가의 시연 (Expert demonstrations)을 필요로 하며 장기 계획 (Long-term planning)을 위한 명시적인 메커니즘이 부족합니다. 본 논문에서는 생성과 계획의 이점을 모두 결합한 새로운 프레임워크인 BeliefDiffusion을 소개합니다. BeliefDiffusion은 확산 모델 (Diffusion models)을 활용하여 다중 모드 신념 분포 (Multimodal belief distributions)를 명시적으로 특징화하고, 모델 예측 제어 (Model Predictive Control, MPC)를 사용하여 동시에 앞서 계획을 세웁니다. 이는 두 단계로 구성됩니다: (1) 관측 이력 (Observation history)을 기반으로 그럴듯한 환경 구성 (Environment configurations)을 상상하기, (2) 집계된 구성들에 대해 효율적인 내비게이션 전략을 계획하기. 합성 지도 환경 (Synthetic map environments)에서의 광범위한 실험을 통해, 우리는 BeliefDiffusion이 내비게이션 성공률과 경로 효율성 측면에서 모델 프리 강화학습 (Model-free reinforcement learning) 베이스라인 및 기타 생성적 접근 방식보다 크게 우수함을 입증합니다. 우리의 결과는 다중 모드 신념 표현 (Multimodal belief representations)을 계획에 명시적으로 통합하는 것이 부분 관측 가능 설정에서 더 견고한 내비게이션을 가능하게 함을 검증합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0