본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 20. 01:20

BLAgent: 파일 수준 버그 위치 파악을 위한 에이전트 기반 RAG

요약

BLAgent는 파일 수준의 버그 위치 파악을 위해 에이전트 기반 RAG 프레임워크를 제안합니다. AST 기반 청킹, 이중 관점 쿼리 변환, 2단계 에이전트 재순위화 기술을 통해 코드 구조와 행동 신호를 모두 포착하며, 기존 방식보다 높은 정확도와 비용 효율성을 제공합니다. SWE-bench Lite 테스트 결과, 폐쇄형 모델 기준 86% 이상의 정확도를 기록하며 자동 프로그램 수정(APR) 성능을 크게 향상시켰습니다.

핵심 포인트

  • AST 기반 청킹을 통해 코드의 구조적 맥락을 보존하는 저장소 인코딩 방식 도입
  • 구조적 및 행동적 신호를 모두 고려하는 이중 관점 쿼리 변환 기술 적용
  • 기호적 검사와 증거 기반 추론을 결합한 2단계 에이전트 재순위화 프로세스
  • 제한된 추론(Bounded reasoning)을 통해 정확도와 비용 사이의 최적의 균형 달성
  • SWE-bench Lite에서 기존 베이스라인 대비 18배 저렴한 비용으로 높은 성능 입증

최근 대규모 언어 모델 (LLM) 기반의 수정 시스템의 발전에도 불구하고, 버그 위치 파악 (Bug localization)은 근본 원인 분석 (Root cause analysis), 분류 (Triage), 자동 프로그램 수정 (Automated Program Repair, APR)을 포함한 다운스트림 소프트웨어 유지보수 작업에서 여전히 주요한 병목 현상으로 남아 있습니다. 파일 수준의 버그 위치 파악은 계층적 파이프라인에서 특히 중요한데, 여기서 발생하는 오류는 문장 수준의 위치 파악 (Statement-level localization)이나 패치 생성 (Patch generation)과 같은 다운스트림 단계로 전파될 수 있기 때문입니다. 검색 증강 생성 (Retrieval-Augmented Generation, RAG)은 LLM을 저장소 컨텍스트에 접지 (Grounding)시키는 유망한 방향을 제시하지만, 기존의 RAG 파이프라인은 정적 검색에 의존하며 결함이 있는 코드를 정확하게 식별하는 데 필요한 추론 능력이 부족합니다. 본 연구에서는 세 가지 핵심 아이디어를 통합한 파일 수준 버그 위치 파악을 위한 새로운 에이전트 기반 RAG 프레임워크인 BLAgent를 제안합니다: (i) 경로가 보강된 AST 기반 청킹 (AST-based chunking)을 통한 코드 구조 인식 저장소 인코딩, (ii) 구조적 신호와 행동적 신호를 모두 포착하는 이중 관점 쿼리 변환, (iii) 기호적 검사 (Symbolic inspection)와 증거 기반 추론 (Evidence-grounded reasoning)을 결합한 2단계 에이전트 재순위화 (Agentic reranking). 기존의 그래프 기반 또는 멀티홉 (Multi-hop) 에이전트 방식과 달리, BLAgent는 압축된 후보 집합에 대해 제한된 추론 (Bounded reasoning)을 수행하여 정확도와 비용 사이의 균형을 맞춥니다. SWE-bench Lite에서 BLAgent는 오픈 소스 모델로 78% 이상의 Top-1 정확도를, 폐쇄형 모델로 86% 이상의 정확도를 달성하였으며, 동일한 모델을 사용하는 가장 강력한 베이스라인보다 18배 이상 저렴합니다. APR 프레임워크에 통합되었을 때, 이는 엔드 투 엔드 (End-to-end) 수정 성공률을 20% 이상 향상시킵니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0