arXiv논문2026. 06. 24. 10:14

코딩 에이전트를 위한 베이지안 제어 (Bayesian control)

요약

코딩 에이전트의 도구 사용 결정을 비용 민감형 순차 가설 검정으로 공식화한 베이지안 제어 방식을 제안합니다. 이 방식은 불확실성을 고려하여 증거 수집, 후보 개선, 검증 여부를 동적으로 결정하며 높은 효율성을 보여줍니다.

핵심 포인트

베이지안 제어기를 통한 동적 오케스트레이션 구현
비용 민감형 순차 가설 검정 프레임워크 도입
검증 비용이 높고 비평가가 불완전한 환경에서 탁월한 성능
토큰 확률보다 뛰어난 해석 가능한 정확도 점수 제공

현대의 코딩 에이전트 (coding agents)는 저렴한 진단 도구 (diagnostics)와 비용이 많이 드는 검증기 (verifiers)를 포함한 다양한 도구들을 LLM 생성기 (LLM generators)와 결합하여 사용합니다. 도구 사용 결정은 일반적으로 고정된 규칙을 사용하고 불확실성 (uncertainty)을 무시하는 오케스트레이터 (orchestrators)에 의해 제어됩니다. 우리는 오케스트레이션을 비용 민감형 순차 가설 검정 (cost-sensitive sequential hypothesis testing)으로 공식화합니다. 즉, 베이지안 제어기 (Bayesian controller)가 후보 정답의 정확성에 대한 믿음 (belief)을 유지하며, 더 많은 증거를 수집할지, 후보를 개선할지, 검증할지, 아니면 중단할지를 동적으로 결정합니다. 6개의 생성기와 9개의 코딩 벤치마크 (benchmarks)에 걸쳐 테스트한 결과, 베이지안 제어는 검증 비용이 높고 비평가 (critics)가 유익하지만 불완전할 때 가장 가치 있는 것으로 증명되었습니다. 제어를 넘어, 믿음 상태 (belief state)는 불확실성 정량화 (uncertainty quantification)를 위해 토큰 확률 (token-probability) 및 원시 도구 성공 (raw tool-success) 베이스라인보다 뛰어난 성능을 보이는 해석 가능한 정확도 점수를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

코딩 에이전트를 위한 베이지안 제어 (Bayesian control)

요약

핵심 포인트

댓글