본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 04. 28. 14:59

LLM 기반 주의 기반 재순위화 (Attention-based Re-ranking) 를 위한 쿼리 라우팅 학습

요약

최근 연구되는 LLM 기반 주의 기반 재순위화는 문서 관련성 추정에 효과적이지만, 기존 방식들은 모든 헤드를 집계하거나 정적인 하위 집합에 의존하여 최적의 성능을 내기 어렵습니다. 본 논문은 쿼리마다 가장 적합한 헤드 집합을 선택하는 'RouteHead'라는 경량 라우터를 제안합니다. 이 라우터는 각 쿼리를 최적의 헤드들로 매핑하고, 관련성 점수를 오직 선택된 헤드의 주의 신호만을 이용해 계산함으로써 성능 저하 문제를 해결합니다.

핵심 포인트

  • LLM 기반 재순위화는 주의 신호를 활용하여 문서 관련성을 추정하는 강력한 방법론이다.
  • 기존의 주의 집계 방식은 모든 헤드를 사용하거나 정적 선택에 의존하여 성능 한계를 가진다.
  • 제안된 RouteHead는 쿼리(Query)별로 최적의 헤드(Head) 하위 집합을 동적으로 라우팅하고 선택하는 경량 아키텍처이다.
  • 학습 과정에서는 오프라인 검색을 통해 생성된 가짜 라벨과 희소성 정규화자를 사용하여 쿼리-헤드 매핑을 최적화한다.

대형 언어 모델 (Large Language Models, LLMs) 은 주의 신호 (attention signals) 를 활용하여 문서 관련성을 추정함으로써 세분화된 제로샷 재순위기 (fine-grained zero-shot re-rankers) 로 최근 연구되고 있습니다. 그러나 기존 방법들은 모든 헤드에 걸친 주의 신호를 집계하거나, 휴리스틱 규칙에 의해 식별된 정적 선택 하위 집합에 의존합니다. 이 해법은 정보량이 풍부한 헤드가 쿼리나 도메인마다 달라질 수 있기 때문에 최적의 성능을 내지 못할 수 있습니다. 또한, 다중 헤드를 단순하게 결합하는 것은 중복성이나 상충되는 순위 신호 (conflicting ranking signals) 로 인해 성능이 저하될 수 있습니다. 본 논문에서는 LLM 을 활용한 주의 기반 재순위화를 위한 쿼리 의존적 헤드 선택 방법인 RouteHead 를 제안합니다. 구체적으로, 우리는 각 쿼리를 최적의 헤드 집합으로 매핑할 수 있는 경량 라우터 (router) 를 학습시키며, 관련성 점수는 오직 이 헤드들로부터만 주의 신호를 집계하여 계산합니다. 쿼리-헤드 최적 라벨이 이용 불가능하므로, 먼저 오프라인 검색을 통해 가짜 라벨 (pseudo labels) 을 구성합니다. 라우터는 각 헤드를 학습 가능한 임베딩으로, 각 쿼리는 고정된 LLM 의 숨겨진 상태 (hidden states) 에서 추출된 임베딩으로 표현합니다. 그런 다음 가짜 라벨과 희소성 정규화자 (sparsity regularizer) 를 사용하여 학습됩니다. 다양한 벤치마크와 여러 LLM 백본에 대한 실험 결과, 제안된 방법이 강력한 베이스라인을 일관되게 능가함을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0