국소적 일관성, 전역적 비일관성: 다중 구성 요소 LLM 에이전트에서의 구성적 비일관성 경계 설정
요약
다중 구성 요소 LLM 에이전트에서 개별 요소는 일관적이지만 전체 시스템은 비일관해지는 '구성적 비일관성' 문제를 수학적으로 공식화했습니다. 구성적 잔차($\epsilon^*$)를 통해 이를 측정하며, 기존의 검색이나 프롬프팅 방식이 이 문제를 해결하는 데 한계가 있음을 입증했습니다.
핵심 포인트
- 국소적 일관성이 전역적 비일관성으로 이어지는 현상 규명
- 구성적 잔차($\epsilon^*$)를 통한 시스템 비일관성 정량적 측정
- Rayleigh-quotient 및 Boyle-Dykstra 투영을 통한 복구 방법론 제시
- 기존 완화 방법(검색, 프롬프팅 등)의 성능 저하 및 한계 확인
다중 구성 요소 LLM (Large Language Model) 에이전트는 공동 문제의 일부만을 보는 각 구성 요소로부터 확률적 주장(probabilistic claims)을 조립합니다. 이때 모든 구성 요소가 국소적으로 일관적(locally coherent)일지라도, 그 구성(composition) 과정에서 기본적인 확률 공리(probability axioms)를 위반할 수 있습니다. 우리는 이러한 국소적 일관성, 전역적 비일관성(locally coherent, globally incoherent) 실패를 구성적 잔차(compositional residual) $\epsilon^$를 통해 공식화합니다. $\epsilon^$는 구성된 인용(composed quote)과 공동 일관적 다포체(joint coherent polytope) 사이의 $L_2$ 거리로, 시스템 출력과 선언된 구성 요소 간 결합 제약 조건(cross-component coupling constraints)으로부터 실행 시점에 계산 가능합니다. 제품 구조 이분법(product-structure dichotomy)은 국소적 일관성이 충분한 경우를 특징짓고, Rayleigh-quotient 예측은 4개의 관계 클래스 중 3개에서 관찰된 잔차와 7% 이내의 일치율을 보입니다. 계층적 Boyle-Dykstra 투영(hierarchical Boyle-Dykstra projection)은 구성을 결정론적으로 복구하며, 언제든 유효한(anytime-valid) $e$-프로세스는 순차적 일관성 모니터링을 제공합니다. 4개의 LLM 미드티어 패널(frontier-panel은 섹션 5.5에서 재실행)에 대한 1,876개의 앙상블 클리크(ensemble cliques)를 대상으로 조사한 결과, 클리크의 33-94%에서 $\epsilon^* > 0$이 나타났으며, 이는 비례 배분 규칙(proportional allocation rule) 하에 해결된 1,770개의 베팅에서 베팅당 +0.115 nats의 후회(regret)로 번역됩니다(베팅 주체 자체가 일관성을 확보하는 경우 이 이득은 +0.006으로 급감합니다). 세 가지 직관적인 LLM 측면의 완화 방법(검색(retrieval), 분할 인식 프롬프팅(partition-aware prompting), 집계기-LLM(aggregator-LLM))은 각각 실패하거나 성능이 저하되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기