arXiv논문2026. 06. 18. 12:06

Multi-Agent Fictitious Play를 통한 대규모 언어 모델의 의사결정 능력 향상

요약

다중 에이전트 시스템(MAS)에서 발생하는 '관점 얽힘' 문제를 해결하기 위해 게임 이론 기반의 Multi-Agent Fictitious Play(MAFP)를 제안합니다. MAFP는 에이전트들이 상대의 과거 결정에 최적 대응하며 의사결정의 품질과 강건성을 높이는 새로운 패러다임입니다.

핵심 포인트

의사결정 복잡성인 '관점 얽힘(stance entanglement)' 개념 정의
게임 이론의 허구적 놀이(fictitious play) 원리를 MAS에 적용
에이전트 간 상호 의존적 의사결정 문제 해결 능력 입증
기존 베이스라인 대비 토너먼트 강도 및 강건성 지표 우수

대규모 언어 모델 (LLM) 기반의 다중 에이전트 시스템 (MAS)은 협력적인 에이전트들에게 하위 작업 (subtasks)을 분배함으로써 실행 복잡성 (execution complexity)이 있는 과제를 해결하는 데 있어 큰 잠재력을 보여주었습니다. 그러나 이러한 분할 정복 (divide-and-conquer) 패러다임은 현실 세계에서도 흔히 발생하는 의사결정 과제에서는 한계가 있습니다. 이러한 과제들은 서로의 결정이 상호 의존적인 모든 이해관계자 (stakeholders)의 관점으로부터 동시적인 추론을 요구하며, 따라서 고립된 상태에서는 해결될 수 없습니다. 우리는 이 문제를 실행 복잡성 (execution complexity)과는 구별되는 의사결정 복잡성의 한 형태인 관점 얽힘 (stance entanglement)으로 규정합니다. 이를 해결하기 위해, 우리는 이해관계자의 관점을 에이전트로 표현하고 의사결정을 평형 추구 과정 (equilibrium-seeking process)으로 공식화하는 새로운 MAS 패러다임인 Multi-Agent Fictitious Play (MAFP)를 제안합니다. 허구적 놀이 (fictitious play)라는 게임 이론적 원리에 기반한 MAFP는 다른 에이전트들의 과거 결정의 경험적 혼합 (empirical mixture)에 대해 최적 대응 (best responding)함으로써 각 에이전트의 결정을 반복적으로 업데이트합니다. 이를 통해 에이전트들은 서로의 약점을 드러내고 해결할 수 있으며, 의사결정의 품질과 강건성 (robustness)을 점진적으로 향상시킵니다. 우리는 행동하기 전에 경쟁적인 시나리오를 위한 전략을 결정하는 능력을 테스트하는 도전적인 의사결정 과제에서 MAFP를 평가합니다. MAFP는 토너먼트 강도 (tournament strength)와 강건성 (robustness)이라는 두 가지 상호 보완적인 지표에서 단일 라운드 및 다중 라운드 베이스라인을 모두 능가하며, 관점 얽힘 (stance entanglement)을 해결하는 데 있어 그 효과를 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

Multi-Agent Fictitious Play를 통한 대규모 언어 모델의 의사결정 능력 향상

요약

핵심 포인트

댓글