BLAgent: 파일 수준 버그 위치 파악을 위한 에이전트 기반 RAG

최근 대규모 언어 모델 (LLM) 기반의 수정 시스템의 발전에도 불구하고, 버그 위치 파악 (Bug localization)은 근본 원인 분석 (Root cause analysis), 분류 (Triage), 자동 프로그램 수정 (Automated Program Repair, APR)을 포함한 다운스트림 소프트웨어 유지보수 작업에서 여전히 주요한 병목 현상으로 남아 있습니다. 파일 수준의 버그 위치 파악은 계층적 파이프라인에서 특히 중요한데, 여기서 발생하는 오류는 문장 수준의 위치 파악 (Statement-level localization)이나 패치 생성 (Patch generation)과 같은 다운스트림 단계로 전파될 수 있기 때문입니다. 검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 LLM을 저장소 컨텍스트에 접지 (Grounding)시키는 유망한 방향을 제시하지만, 기존의 RAG 파이프라인은 정적 검색에 의존하며 결함이 있는 코드를 정확하게 식별하는 데 필요한 추론 능력이 부족합니다. 본 연구에서는 세 가지 핵심 아이디어를 통합한 파일 수준 버그 위치 파악을 위한 새로운 에이전트 기반 RAG 프레임워크인 BLAgent를 제안합니다: (i) 경로가 보강된 AST 기반 청킹 (AST-based chunking)을 통한 코드 구조 인식 저장소 인코딩, (ii) 구조적 신호와 행동적 신호를 모두 포착하는 이중 관점 쿼리 변환, (iii) 기호적 검사 (Symbolic inspection)와 증거 기반 추론 (Evidence-grounded reasoning)을 결합한 2단계 에이전트 재순위화 (Agentic reranking). 기존의 그래프 기반 또는 멀티홉 (Multi-hop) 에이전트 방식과 달리, BLAgent는 압축된 후보 집합에 대해 제한된 추론 (Bounded reasoning)을 수행하여 정확도와 비용 사이의 균형을 맞춥니다. SWE-bench Lite에서 BLAgent는 오픈 소스 모델로 78% 이상의 Top-1 정확도를, 폐쇄형 모델로 86% 이상의 정확도를 달성하였으며, 동일한 모델을 사용하는 가장 강력한 베이스라인보다 18배 이상 저렴합니다. APR 프레임워크에 통합되었을 때, 이는 엔드 투 엔드 (End-to-end) 수정 성공률을 20% 이상 향상시킵니다.

Insights

BLAgent: 파일 수준 버그 위치 파악을 위한 에이전트 기반 RAG

요약

핵심 포인트

댓글

Netflix, Disney, Alphabet의 YouTube가 2030년 및 2034년 월드컵 미국 중계권에 주목: 보고서

AI 코딩 에이전트에 '프로그래밍 규율'을 갖춘 6가지 스킬 파이프라인 장착: 코드 변경 시 발생하는 문제 해결

Apple이 2027년 iPad Pro 및 MacBook Pro에 주요 업데이트를 계획 중: 성장을 재점화하기에는 부족하다

Mark Zuckerberg, 예측 시장에 참여하다. Meta의 계획 발표로 관련 주가 하락

AI 코딩 에이전트에 '프로그래밍 규율'을 갖춘 6가지 스킬 파이프라인 장착: 코드 변경 시 발생하는 문제 해결

Apple이 2027년 iPad Pro 및 MacBook Pro에 주요 업데이트를 계획 중: 성장을 재점화하기에는 부족하다

Mark Zuckerberg, 예측 시장에 참여하다. Meta의 계획 발표로 관련 주가 하락