arXiv논문2026. 06. 23. 12:42

근거 있는 스케일링 (Grounded Scaling): 에이전트 AI에 결정론적 환경이 필요한 이유

요약

에이전트 AI의 성공적인 스케일링을 위해 환경의 결정론(determinism)이 필수적임을 논증합니다. 긴 체인의 실행 과정에서 발생하는 실패율을 수학적으로 분석하고, 이를 해결하기 위한 새로운 프레임워크를 제안합니다.

핵심 포인트

단계별 결정론이 낮을수록 긴 체인의 에이전트 성공 확률은 기하급수적으로 감소함
환경의 결정론을 에이전트 AI 발전을 위한 핵심 구속 축으로 정의
공급 확실성 지수(SCI) 및 결정론 성숙도 모델(DMM) 등 구체적 측정 지표 제안
플랫폼에 구애받지 않는 범용적인 에이전트 환경 설계 프레임워크 제시

인간의 허용 범위에 맞춰 설계된 환경에서 긴 체인(Long-chain)의 에이전트 실행은 기하급수적으로 실패합니다. 단계별 결정론(determinism)이 $δ < 1$일 때, $k$단계 체인의 성공 확률은 $δ^k$로 저하됩니다. AGI에서 ASI로의 스케일링 논쟁(Genewein et al., 2026)은 지금까지의 발전을 컴퓨팅 자원 성장과 일련의 마찰 요인들(데이터 장벽, 추상화 장벽, 체화된 병목 현상, 다중 에이전트 신뢰) 사이의 경주로 규정해 왔습니다. 우리는 환경의 결정론(environment determinism)이 경제적, 물리적, 또는 다자간 결제(multi-party settlement)를 통해 결과가 검증 가능한 광범위한 에이전트 AI 작업 범주에서 이 네 가지 모두를 가로지르는 상호 보완적인 구속 축(binding axis)이라고 주장합니다. 세 가지 공식적인 결과가 이 체제를 규정합니다: 체인-태스크 성공에 대한 결정론-효율성 경계(Determinism-Efficiency Bound), 불완전한 보상 하에서의 플라이휠 천장에 대한 검증자-굿하트 법칙 하한선(Verifier-Goodharting Floor), 그리고 환경 측면의 기술 진화를 위한 수렴 조건입니다. 우리는 이 프레임워크를 다섯 가지 측정 가능한 속성에 대한 공급 확실성 지수(Supply Certainty Index, SCI), 도입 사다리로서의 5단계 결정론 성숙도 모델(Determinism Maturity Model, DMM), 그리고 철회를 강제할 명시적인 귀무 결과(null results)를 포함하는 반증 가능한 공개 질문 프로그램(OQ1-OQ5)으로 구체화합니다. 이 입장은 플랫폼에 구애받지 않습니다(platform-agnostic). 우리는 세 가지 경쟁적 입장인 sim-to-real 충분성, 정렬(alignment) 충분성, 그리고 일반 기술로서의 AI(AI-as-normal-technology)와 논의를 진행합니다.

AI 자동 생성 콘텐츠

원문 바로가기

근거 있는 스케일링 (Grounded Scaling): 에이전트 AI에 결정론적 환경이 필요한 이유

요약

핵심 포인트

댓글