DynaTree: 시의성이 중요한 뉴스 검색을 위한 동적 에이전트 기반 검색 트리
요약
DynaTree는 시의성이 중요한 뉴스 검색을 위해 제안된 2단계 에이전트 기반 RAG 프레임워크입니다. 오프라인에서 검색 트리를 구축하고 온라인에서 가벼운 서브트리 선택을 수행하여, 높은 추론 비용 없이도 뉴스 검색의 신선도와 관련성을 크게 개선합니다.
핵심 포인트
- 오프라인 단계에서 조정된 에이전트로 재사용 가능한 검색 트리 구축
- 온라인 단계에서 추가 추론 없이 가벼운 일일 서브트리 선택 수행
- Syft 뉴스 벤치마크 및 BEIR 데이터셋에서 기존 RAG 대비 우수한 성능 입증
- 실제 운영 환경 A/B 테스트를 통해 뉴스 검색의 커버리지와 신선도 개선 확인
에이전트 기반 검색 증강 생성 (Agentic Retrieval-Augmented Generation, RAG)은 계획 (planning), 도구 사용 (tool use), 반복적 추론 (iterative reasoning)을 통합하여 검색 성능을 향상시키지만, 기존의 에이전트 기반 RAG 방식은 종종 짧은 시계 (short-horizon) 추론 루프 내에서 의미론적 확장 (semantic expansion)과 검색 결정을 결합하여 높은 추론 비용을 초래하고 시의성이 중요한 뉴스 검색에 적용하기에는 한계가 있습니다. 우리는 효율적이고 적응적인 뉴스 검색을 위한 2단계 프레임워크인 DynaTree를 제안합니다. 오프라인 단계 (offline stage)에서 DynaTree는 조정된 에이전트 (coordinated agents)를 사용하여 질의 주제의 의미론적 공간 (semantic space)을 구체화하는 재사용 가능한 검색 트리 (retrieval tree)를 구축합니다. 온라인 단계 (online stage)에서 DynaTree는 추가적인 에이전트 추론, 트리 수정 또는 재학습 없이, 시간적으로 국지화된 평가 프록시 (time-localized evaluation proxy)를 통해 가벼운 일일 서브트리 선택 (daily subtree selection)을 수행합니다. 다일(multi-day) Syft 뉴스 벤치마크 및 여러 BEIR 데이터셋에 대한 실험 결과, DynaTree는 강력한 재현율 (recall)과 순위 지정 (ranking) 성능을 달성하였으며, 표준 RAG 및 이전의 에이전트 기반 베이스라인 (agentic baselines)들을 지속적으로 능가했습니다. 우리는 더 나아가 DynaTree를 Syft 운영 시스템에 배포하고 2026년 1월 28일부터 2월 6일까지 온라인 A/B 테스트를 통해 평가했습니다. 동적으로 적응하는 변형 모델은 고정된 오프라인 선택 서브트리에 비해 생존율 (survival rate)을 0.32-0.53에서 0.59-0.73으로 향상시켰으며, 모든 평가일 동안 기존의 운영 환경 검색기 (production recallers)보다 우수한 성능을 보였습니다. 이러한 결과는 지속적이고 구조를 인식하는 의미론적 확장이 오프라인의 에이전트 추론을 실제 뉴스 검색의 커버리지 (coverage), 신선도 (freshness), 관련성 (relevance)에 대한 실질적인 개선으로 전환할 수 있음을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기