arXiv논문2026. 06. 25. 11:50

팀 및 목표 조건부 강화학습 (RL)과 인수분해된 분기 한정법 (Factorized Branch-and-Bound)을 이용한 다중 에이전트

요약

다중 에이전트의 팀 구성과 목표를 추론하는 과정에서 발생하는 조합론적 폭발 문제를 해결하기 위한 새로운 연구를 소개합니다. 인수분해된 분기 한정법(MAGR-BB)을 통해 탐색 효율을 극대화하면서도 정확한 가설 순위를 제공합니다.

핵심 포인트

팀 분할 및 목표 수에 따른 가설 공간의 급격한 증가 문제 해결
인수분해된 분기 한정법을 통한 탐색 효율성 및 속도 개선
가설 구체화 과정을 수십 배 단축하면서도 전수 조사와 동일한 성능 유지
드론 감시 및 협업 로보틱스 등 실제 응용 분야에 적용 가능

다중 에이전트 목표 인식 (Multi-agent goal recognition)은 관찰자가 어떤 에이전트들이 함께 행동하는지, 그리고 각 팀이 무엇을 달성하려고 하는지를 공동으로 추론할 것을 요구하며, 이에 따라 가설 공간은 팀 분할(team partitions)의 수와 팀당 목표의 수에 따라 조합론적으로 증가합니다. 드론 감시나 협업 로보틱스와 같은 실제 응용 분야에서는 에이전트의 궤적(trajectory)만을 노출하므로, 관찰자는 오직 행동만으로 팀-목표 가설의 순위를 매겨야 합니다. 분기 한정법을 이용한 다중 에이전트 목표 인식 (Multi-Agent Goal Recognition with Branch-and-Bound, MAGR-BB)은 인수분해된 분기 한정법 (factorized branch-and-bound) 탐색 내부에서 점수 산정 모델로 사용되는 공유된 팀 및 목표 조건부 정책 (team- and goal-conditioned policy)을 통해 이 설정을 해결합니다. 통제된 다중 에이전트 Blocksworld 벤치마크에서 MAGR-BB는 가설 구체화(hypothesis materialization)를 수십 배 줄이고 누적 인식 실행 시간을 실질적으로 단축하면서도, 궤적 전체에 걸쳐 전수 조사 (exhaustive search)와 동일한 최상위 순위 가설을 반환합니다.

AI 자동 생성 콘텐츠

원문 바로가기

팀 및 목표 조건부 강화학습 (RL)과 인수분해된 분기 한정법 (Factorized Branch-and-Bound)을 이용한 다중 에이전트

요약

핵심 포인트

댓글