arXiv논문2026. 06. 09. 11:51

AbstRAG: 검색 문제를 위한 추상화 학습

요약

RAG 시스템에서 질의와 문서 간의 추상화 수준 차이로 발생하는 '추상화 격차' 문제를 해결하기 위한 AbstRAG를 제안합니다. 성찰적 정제 메커니즘을 통해 검색 실패를 진단하고 단계별 패치를 제안하여 검색 및 생성 정확도를 향상시킵니다.

핵심 포인트

질의와 문서 간의 추상화 격차(Abstraction Gap) 정의
추상화를 명시적 검색 객체로 취급하는 AbstRAG 프레임워크
비판자가 실패를 진단하고 패치를 제안하는 성찰적 정제 메커니즘
벤치마크 테스트를 통한 nDCG@10 및 생성 정확도 향상 입증
압축 제어를 통한 과도한 확장 및 거짓 양성 문제 해결

검색 증강 생성 (Retrieval-augmented generation, RAG)은 질의 (query), 문서 증거 (document evidence), 그리고 사용자의 의도 (user's intent)가 서로 다른 추상화 수준 (levels of abstraction)으로 표현될 때 종종 실패합니다. 질의는 클래스 (class), 관계 (relation), 또는 이벤트 (event)에 대해 묻는 반면, 문서는 오직 구체적인 사례 (specific instances), 간접적인 프레이밍 (indirect framings), 또는 범위가 제한된 공식화 (scoped formulations)만을 기술할 수 있습니다. 우리는 이러한 불일치를 추상화 격차 (abstraction gap)로 정의합니다. 즉, 질의 의도를 가용한 증거와 정렬하는 데 필요한 유형화된 가정 (typed assumptions)의 최소 집합입니다. 이 격차를 해소하기 위해, 우리는 추상화를 명시적인 검색 객체 (retrieval object)로 취급하는 AbstRAG를 소개합니다. AbstRAG는 질의-증거 간의 격차를 표현 (expression), 개념 (conceptual), 의도-증거 (intent-evidence), 그리고 이벤트 유형 (event-type) 구성 요소로 분해하며, 매칭 품질 (match quality), 질의와 무관한 유틸리티 사전 확률 (query-independent utility prior), 그리고 필요한 가교 (bridges)의 비용을 결합하여 관련성 점수를 산출합니다. 핵심 메커니즘은 성찰적 정제 (reflective refinement)입니다. 이는 비판자 (critic)가 검색 실패를 진단하고, 실패한 추상화 연산자 (abstraction operator)의 위치를 파악하며, 최소한의 단계별 패치 (stage-specific patch)를 제안하고, 충분성 (sufficiency) 및 압축 제어 (compression controls) 하에서만 해당 패치를 수용하는 방식입니다. 7개의 베이스라인 (baselines)과 비교한 3개의 문서 내 검색 벤치마크 (within-document retrieval benchmarks) 전반에서, AbstRAG는 21개의 쌍별 부트스트랩 (paired-bootstrap) 대조 중 18개에서 nDCG@10 성능을 상회하였으며, 세 가지 벤치마크에서 생성 정확도 (generation accuracy)를 각각 1.9%, 5.2%, 4.0% 향상시켰습니다. 절제 연구 (ablations)를 통해 성찰적 정제가 검색 이득의 대부분을 주도하며, 압축 제어만으로도 스트레스 슬라이스 (stress slice)에서 과도한 확장으로 인한 거짓 양성 (over-expansion false positives)을 73.7%에서 0%로 줄임을 확인했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AbstRAG: 검색 문제를 위한 추상화 학습

요약

핵심 포인트

댓글