Multi-Agent Fictitious Play를 통한 대규모 언어 모델의 의사결정 능력 향상
요약
다중 에이전트 시스템(MAS)에서 발생하는 '관점 얽힘' 문제를 해결하기 위해 게임 이론 기반의 Multi-Agent Fictitious Play(MAFP)를 제안합니다. MAFP는 에이전트들이 상대의 과거 결정에 최적 대응하며 의사결정의 품질과 강건성을 높이는 새로운 패러다임입니다.
핵심 포인트
- 의사결정 복잡성인 '관점 얽힘(stance entanglement)' 개념 정의
- 게임 이론의 허구적 놀이(fictitious play) 원리를 MAS에 적용
- 에이전트 간 상호 의존적 의사결정 문제 해결 능력 입증
- 기존 베이스라인 대비 토너먼트 강도 및 강건성 지표 우수
대규모 언어 모델 (LLM) 기반의 다중 에이전트 시스템 (MAS)은 협력적인 에이전트들에게 하위 작업 (subtasks)을 분배함으로써 실행 복잡성 (execution complexity)이 있는 과제를 해결하는 데 있어 큰 잠재력을 보여주었습니다. 그러나 이러한 분할 정복 (divide-and-conquer) 패러다임은 현실 세계에서도 흔히 발생하는 의사결정 과제에서는 한계가 있습니다. 이러한 과제들은 서로의 결정이 상호 의존적인 모든 이해관계자 (stakeholders)의 관점으로부터 동시적인 추론을 요구하며, 따라서 고립된 상태에서는 해결될 수 없습니다. 우리는 이 문제를 실행 복잡성 (execution complexity)과는 구별되는 의사결정 복잡성의 한 형태인 관점 얽힘 (stance entanglement)으로 규정합니다. 이를 해결하기 위해, 우리는 이해관계자의 관점을 에이전트로 표현하고 의사결정을 평형 추구 과정 (equilibrium-seeking process)으로 공식화하는 새로운 MAS 패러다임인 Multi-Agent Fictitious Play (MAFP)를 제안합니다. 허구적 놀이 (fictitious play)라는 게임 이론적 원리에 기반한 MAFP는 다른 에이전트들의 과거 결정의 경험적 혼합 (empirical mixture)에 대해 최적 대응 (best responding)함으로써 각 에이전트의 결정을 반복적으로 업데이트합니다. 이를 통해 에이전트들은 서로의 약점을 드러내고 해결할 수 있으며, 의사결정의 품질과 강건성 (robustness)을 점진적으로 향상시킵니다. 우리는 행동하기 전에 경쟁적인 시나리오를 위한 전략을 결정하는 능력을 테스트하는 도전적인 의사결정 과제에서 MAFP를 평가합니다. MAFP는 토너먼트 강도 (tournament strength)와 강건성 (robustness)이라는 두 가지 상호 보완적인 지표에서 단일 라운드 및 다중 라운드 베이스라인을 모두 능가하며, 관점 얽힘 (stance entanglement)을 해결하는 데 있어 그 효과를 입증합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기