본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 10. 11:17

사고와 발화의 분리: 회복 탄력적인 다중 에이전트 논증을 위한 지식 기반 반사실적 추론

요약

다중 에이전트 토론의 안정성을 높이기 위해 사고와 발화를 분리한 KG-CFR 아키텍처를 제안합니다. 검색 증강 계획 버퍼를 통해 논리 저하와 역할 이탈을 방지하며, 불확실한 환경에서도 높은 회복 탄력성을 입증했습니다.

핵심 포인트

  • 사고(계획)와 발화(실행)를 분리하여 시스템 안정성 강화
  • KG-CFR 아키텍처를 통한 논리 저하 및 역할 이탈 방지
  • 위기 시뮬레이션 환경에서 논증 품질을 0.694에서 0.822로 향상
  • 의미론적 루핑 감소 및 계획-실행 정렬 최적화

다중 에이전트 토론 (Multi-agent debate) 프레임워크는 수렴형 작업 (convergent tasks)에서 대규모 언어 모델 (LLM)의 성능을 향상시키는 것으로 나타났으나, 현재는 프로세스의 안정성보다는 최종 출력의 정확도에 과도하게 치중하여 최적화되어 있습니다. 장기적인 교환 (long-horizon exchanges) 과정에서 지속적인 섭동 (perturbations) 하에 있는 반응형 시스템은 종종 논리 저하, 논증 반복, 그리고 역할 이탈 (role drift)을 경험합니다. 정체성 상실을 구조적으로 방지하고 프로세스 충실도 (process fidelity)를 유지하기 위해, 우리는 검색 증강 계획 버퍼 (retrieval-augmented planning buffer)라는 비공개 영역과 공개 실행 계층 (public execution layer) 사이의 엄격한 관심사 분리 (separation of concerns)를 강제하는 2단계 아키텍처인 지식 기반 반사실적 추론 (Knowledge-Grounded Counterfactual Reasoning, KG-CFR)을 도입합니다. 우리는 표준 토론 설정과는 구별되는 다양성을 도입한 전용 1v1v1 환경인 불확실성 하의 동적 자원 할당 (Dynamic Resource Allocation under Uncertainty, DRAU)에서 이 시스템을 평가합니다. 확률적 환경 충격 (stochastic environmental shocks)이 포함된 270개 이상의 완전 요인 위기 시뮬레이션 궤적 (completely factorial crisis simulation trajectories)을 통해, KG-CFR은 섭동이 발생한 실행의 95% 이상에서 판사(judge)가 감지한 충격 후의 치명적 저하(품질 변화 $Δ ext{ }\le -0.20$로 정의됨)를 방지하며, 전체 논증 품질을 0.694에서 0.822로 향상시켰습니다. 우리의 주요 기여는 아키텍처의 디커플링 (decoupling)이 품질 저하 없이 지속적인 압박 하에서 시스템적 회복 탄력성 (systemic resilience)을 강화하는 중요한 요소임을 입증한 것입니다. 또한, 우리는 담화 발산 (discourse divergence)과 계획-실행 정렬 (plan-execution alignment)을 위한 맞춤형 벡터 지표를 도입하여 운영 안정성에 대한 강력하고 방향성 일관된 증거를 제공합니다. 우리의 절제 실험 (ablation experiments)은 적절한 교리적 근거 (doctrinal grounding)가 향후 계획 (prospective planning)만큼이나 논증 품질에 중요한 요소가 될 수 있음을 시사합니다. 초기 지표 평가에 따르면, KG-CFR은 에이전트가 원래 계획과의 일관성을 유지하도록 함으로써 의미론적 루핑 (semantic looping)을 줄입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0