실행 특징(Execution Features)이 통계적 결함 국지화(Statistical Fault Localization)를 어떻게

자동 결함 국지화(Automated fault localization)는 개발자가 대규모 코드베이스에서 결함을 찾는 것을 돕습니다. 통계적 결함 국지화(Statistical fault localization, SFL)는 통과/실패 스펙트럼(pass/fail spectra)으로부터 의심스러운 라인들의 순위를 매기지만, 라인 실행(line execution)만으로는 실패가 발생하는 이유를 설명하는 데이터 흐름(data-flow), 값(values), 또는 분기 조건(branch conditions)과 같은 정보를 놓치게 됩니다. 본 연구는 실행 특징(execution features)을 SFL에 증강하는 것이 국지화 정확도와 개발자 중심의 검사 노력(inspection effort)을 개선하는지 평가합니다. 우리는 모든 Tests4Py 피사체(subjects)에 대해 EFDD를 사용하여 실행 특징을 추출하고, 피사체별로 랜덤 포레스트(random forests)를 학습시키며, 중요도(importances)를 소스 라인에 매핑한 후, 결과로 나온 가중치를 기존의 SFL 공식과 결합합니다. 평가는 혼란 변수 조정 혼합 효과 모델(confounder-adjusted mixed-effects model)을 사용하여 참조 패치 정확도(reference-patch accuracy), 라인 및 함수 수준의 노력(line- and function-level effort), 강건성(robustness), 그리고 실행 가능성(feasibility)을 측정하며, 이는 쌍체 통계 검정(paired statistical tests) 및 결과 중립적 품질 검사(outcome-neutral quality checks)를 통해 뒷받침됩니다.

Insights

실행 특징(Execution Features)이 통계적 결함 국지화(Statistical Fault Localization)를 어떻게

요약

핵심 포인트

댓글

코딩 에이전트의 SWE-chat 계획 태스크를 위한 지속적 저장소 메모리 (persistent repo memory) 벤치마킹

shot-scraper video를 사용하여 에이전트가 작업 결과의 비디오 데모를 기록하게 하세요

sqlite-utils 4.0rc1

HTML 테이블 추출기

코딩 에이전트의 SWE-chat 계획 태스크를 위한 지속적 저장소 메모리 (persistent repo memory) 벤치마킹

shot-scraper video를 사용하여 에이전트가 작업 결과의 비디오 데모를 기록하게 하세요

sqlite-utils 4.0rc1

HTML 테이블 추출기