추론 집약적 검색 (Reasoning-Intensive Retrieval) 재고: 에이전트 기반 검색 시스템의 리트리버 평가 및 개선

추론 집약적 검색 (reasoning-intensive retrieval) 은 단순한 주제 유사성 매칭을 넘어 downstream reasoning 을 지원할 수 있는 증거를 표출하는 것을 목표로 합니다. 이러한 능력은 iterated search 와 synthesis 를 통해 보완적인 증거를 제공해야 하는 에이전트 기반 검색 시스템 (agentic search systems) 에서 점점 더 중요해지고 있습니다. 그러나 기존 연구는 평가와 훈련 측면에서 여전히 제한적입니다: BRIGHT 와 같은 벤치마크는 좁은 gold set 을 제공하고 리트리버를 고립된 상태로 평가하며, 합성 훈련 코퍼스는 단일 패스 관련성 (single-passage relevance) 이 아닌 증거 포트폴리오 구축 (evidence portfolio construction) 을 최적화하지 않습니다. 우리는 각 쿼리를 다면적 gold evidence 로 확장하고 정적 (static) 과 에이전트 기반 (agentic) 검색 프로토콜 하에서 리트리버를 평가하는 전문가 주석 벤치마크인 BRIGHT-Pro 를 소개합니다. 또한, RTriever-4B 를 Qwen3-Embedding-4B 에서 LoRA fine-tune 하는 데 사용되는 측면 분해 합성 코퍼스인 RTriever-Synth 을 구성했습니다. 이는 보완적인 positive 와 positive-conditioned hard negative 를 생성합니다. 단어 (lexical), 일반 목적 (general-purpose), 추론 집약적 (reasoning-intensive) 리트리버에 대한 실험은 aspect-aware 와 agentic 평가가 표준 지표로 숨겨진 행동을 드러내며, RTriever-4B 는 기본 모델보다 현저히 개선됨을 보여줍니다.

Insights

추론 집약적 검색 (Reasoning-Intensive Retrieval) 재고: 에이전트 기반 검색 시스템의 리트리버 평가 및 개선

요약

핵심 포인트

댓글

Claude Code 설정을 관리하기 위해 로컬 웹 UI를 만들었습니다

프로덕션 환경에서의 AI 모델 라우팅(Model Routing): 개발 팀이 아마도 놓쳤을 아키텍처 패턴

프롬프트 엔지니어링을 넘어: 2026년 제어 가능한 AI 이미지 합성 마스터하기

OpenAI Agents SDK RunState: 중복 부작용 없이 도구 승인 재개하기

Claude Code 설정을 관리하기 위해 로컬 웹 UI를 만들었습니다

프로덕션 환경에서의 AI 모델 라우팅(Model Routing): 개발 팀이 아마도 놓쳤을 아키텍처 패턴

프롬프트 엔지니어링을 넘어: 2026년 제어 가능한 AI 이미지 합성 마스터하기

OpenAI Agents SDK RunState: 중복 부작용 없이 도구 승인 재개하기