arXiv논문2026. 06. 15. 11:22

ADORE: 검색 기반 관련성 피드백을 활용한 반복적 쿼리 확장 (Iterative Query Expansion with

요약

ADORE는 검색 결과의 피드백을 활용하여 쿼리를 반복적으로 확장하는 새로운 프레임워크를 제안합니다. 기존의 생성 주도적 방식이 유발하는 검색 드리프트 문제를 해결하며, 다양한 벤치마크에서 기존 베이스라인을 뛰어넘는 성능 향상을 입증했습니다.

핵심 포인트

검색 기반 피드백을 통한 반복적 쿼리 확장 프레임워크 ADORE 제안
LLM 생성과 검색기 반응, 관련성 평가를 결합한 루프 구조
검색 드리프트 및 오해의 소지가 있는 어휘 증폭 문제 해결
BEIR 및 BRIGHT 벤치마크에서 기존 방법론 대비 성능 대폭 향상

LLM 기반의 쿼리 확장 (Query Expansion)은 추가적인 문맥을 통해 원래의 쿼리를 풍부하게 함으로써 검색 성능을 향상시킵니다. 그러나 대부분의 방법론은 생성 주도적 (generation-driven)인 상태로 남아 있어, 타겟 코퍼스 (corpus)가 어떻게 반응하는지 확인하지 않은 채 그럴듯한 의사 문서 (pseudo-documents)나 확장 문구를 생성합니다. 이는 검색 드리프트 (retrieval drift)를 유발하거나, 오해의 소지가 있는 어휘를 증폭시키거나, 관련 문서와 비관련 문서를 구분하는 용어를 놓칠 수 있습니다. 우리는 효과적인 확장을 위해서는 단순한 단일 패스 생성 (single-pass generation)이나 검증되지 않은 반복이 아닌, 검색에 기반한 피드백 (retrieval-grounded feedback)이 필요하다고 주장합니다. 우리는 검색 결과를 다음 확장을 위한 피드백으로 전환하는 반복적 프레임워크인 ADORE (ADapt, Observe, Relevance Evaluate)를 소개합니다. 각 라운드에서 LLM은 의사 구절 (pseudo-passages)을 생성하고, 검색기 (retriever)는 코퍼스의 반응을 드러내며, 관련성 평가기 (relevance assessor)는 검색된 문서들을 원래의 쿼리와 비교하여 평가합니다. 이러한 판단을 통해 무엇을 강화할지, 무엇이 여전히 충분히 다뤄지지 않았는지, 그리고 무엇을 억제할지를 식별합니다. TREC Deep Learning, BEIR, 그리고 BRIGHT 벤치마크 전반에 걸쳐, ADORE는 거의 모든 평가 설정에서 눈에 띄는 개선을 보이며 강력한 쿼리 확장 베이스라인 (baselines)들을 일관되게 능가했습니다. 구체적으로 BEIR에서는 BM25 대비 평균 nDCG@10을 24.5% 향상시켰고, 기존의 가장 강력한 쿼리 확장 방법론 대비 3.6% 향상시켰으며, BRIGHT에서는 BM25 대비 122.9% 향상시켰고 최상의 쿼리 확장 베이스라인 대비 9.2% 향상시켰습니다. 우리의 코드와 데이터는 공개적으로 사용 가능합니다.

AI 자동 생성 콘텐츠

원문 바로가기

ADORE: 검색 기반 관련성 피드백을 활용한 반복적 쿼리 확장 (Iterative Query Expansion with

요약

핵심 포인트

댓글