불확실한 도메인에서의 관찰 인지 계획 (Observation-aware Planning) 확장
요약
불확실한 도메인에서 에이전트의 센싱 능력을 최적화하는 관찰 인지 계획(Observation-aware Planning) 연구를 소개합니다. POMDP 모델을 기반으로 센서 선택 및 위치 관측 가능성 문제를 해결하기 위한 새로운 (부)기호적 기법을 제안합니다.
핵심 포인트
- POMDP 기반의 최적 관측 가능성 문제(OOP) 해결 방법 연구
- 센서 선택(SSP) 및 위치 관측 가능성(POP) 문제 확장
- POMDP 분해를 통한 합리적인 관찰 함수 식별 기법 개발
- 기존 방식 대비 인스턴스 크기 3배, 실행 시간 5배 성능 향상
불확실한 도메인 (Uncertain domains)에서 에이전트에게 어떤 감지 능력 (Sensing capabilities)을 배치할지 결정하는 것은, 작업 달성 가능성 (Task achievability)과 하드웨어 및 처리 비용 사이의 균형을 맞추어야 하는 근본적인 공학적 과제입니다. 이 문제는 의사결정을 위한 잘 알려진 부분 관측 마르코프 결정 과정 (Partially Observable Markov Decision Process, POMDP) 모델을 기반으로, 이전에 최적 관측 가능성 문제 (Optimal Observability Problem, OOP)로 공식화되었습니다. 본 연구는 OOP의 결정 가능한 파편들, 즉 센서 선택 문제 (Sensor Selection Problem, SSP)와 위치 관측 가능성 문제 (Positional Observability Problem, POP)의 해결을 확장하기 위한 (부)기호적 (sub-symbolic) 기법들을 연구합니다. 매개변수 합성 (Parameter synthesis)에 기반한 기존 접근 방식을 개선하는 것 외에도, 우리는 POMDP의 분해 (Decomposition)를 통해 합리적인 관찰 함수 (Observation functions)를 식별하는 새로운 해결 방법을 개발하였으며, 이를 통해 인스턴스 크기와 실행 시간 측면에서 각각 3배와 5배의 성능 향상을 달성했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기