arXiv논문2026. 05. 27. 11:32

EviACT: 에이전트 기반 프로그램 수정을 위한 증거 기반 실행 프레임워크

요약

EviACT는 실행 증거를 활용하여 프로그램 수정을 자동화하는 에이전트 기반 프레임워크입니다. 검색, 컴파일, 테스트 기반의 세 가지 가드레일을 통해 수정의 정확도를 높이고 API 비용을 획기적으로 절감합니다.

핵심 포인트

증거 기반 가드레일을 통한 프로그램 수정 프로세스 최적화
기존 베이스라인 대비 해결률 1.6~6.0%p 향상
버그당 API 비용을 최대 88.6%까지 절감
검색, 컴파일, 테스트 주도 게이트를 통한 효율적 에이전트 운용

LLM 기반 에이전트(LLM-based agents)는 자동 프로그램 수정 (Automated Program Repair, APR)을 고정된 컨텍스트의 패치 생성 방식에서 상호작용적인 저장소 수준(repository-level)의 수정 방식으로 발전시켜 왔습니다. 그러나 기존의 에이전트 기반 APR 시스템은 실행 증거(execution evidence)를 사용하여 위치 파악(localization), 패치 생성(patch generation) 및 검증(validation)을 안내하는 데 여전히 어려움을 겪고 있습니다. 우리는 수정 단계 전반에 걸쳐 세 가지 증거 기반 가드레일(guardrails)을 조정하는 에이전트 기반 APR 프레임워크인 EviACT (Evidence-to-Action)를 제안합니다. 검색 스캐폴드(retrieval scaffold)는 수정 컨텍스트를 근거화하고, 컴파일 게이트(compile gate)는 유효하지 않은 편집을 필터링하며, 테스트 주도 게이트(test-driven gate)는 전체 회귀 테스트(regression) 전에 타겟 테스트 복구(target-test recovery)를 확인합니다. 4개의 벤치마크를 통해 EviACT는 가장 강력하다고 보고된 비교 가능한 베이스라인(baselines)보다 해결률(resolve rate)을 1.6~~6.0%포인트 향상시켰으며, 베이스라인 비용 확인이 가능한 경우 버그당 API 비용이 70.1~~88.6% 더 낮음을 보여주었습니다. 절제 연구(Ablations) 및 진단 결과, 이러한 이점은 조정된 증거-실행(evidence-to-action) 체인과 관련이 있으며, 이를 통해 에이전트 기반 APR을 더욱 효과적이고 효율적으로 만듭니다.

AI 자동 생성 콘텐츠

원문 바로가기

EviACT: 에이전트 기반 프로그램 수정을 위한 증거 기반 실행 프레임워크

요약

핵심 포인트

댓글