arXiv논문2026. 05. 07. 12:44

LongSeeker: 장기 지평 검색 에이전트를 위한 탄성 컨텍스트 오케스트레이션

요약

본 논문은 복잡하고 긴 작업을 수행하는 검색 에이전트(long-horizon search agent)가 직면하는 컨텍스트 관리 문제를 해결하기 위해 '탄성 컨텍스트 오케스트레이션' 패러다임을 제안합니다. 이 패러다임은 Context-ReAct이라는 통합 루프를 통해 Skip, Compress, Rollback, Snippet, Delete와 같은 5가지 원자 연산을 제공하여 에이전트가 작업의 관련성에 따라 컨텍스트를 동적으로 재구성할 수 있게 합니다. 이를 기반으로 개발된 LongSeeker는 기존 검색 벤치마크에서 높은 성능을 보여주며, 적응적 컨텍스트 관리가 장기 지평 추론의 신뢰성과 효율성을 크게 향상시킬 수 있음을 입증했습니다.

핵심 포인트

장기 지평 에이전트는 작업 컨텍스트가 폭발적으로 증가하는 문제를 겪는다.
Context-ReAct은 Skip, Compress, Rollback, Snippet, Delete 등 5가지 연산을 통해 컨텍스트를 동적으로 관리할 수 있게 한다.
Compress 연산자는 표현력 완전성을 증명했으며, 다른 연산자들은 효율성과 충실성 보장을 제공한다.
LongSeeker는 적응적 컨텍스트 관리를 통해 기존 검색 벤치마크에서 높은 성능을 달성했다.

장기 지평 (long-horizon) 검색 에이전트는 추론, 도구 호출, 정보 관찰 과정에서 빠르게 성장하는 작업 컨텍스트를 관리해야 합니다. 모든 중간 내용을 무리하게 누적하면 에이전트가 압도당하고 비용이 증가하며 오류 위험이 커집니다. 우리는 효과적인 컨텍스트 관리는 적응적이어야 한다고 제안합니다: 에이전트의 궤적의 일부는 현재 작업에 대한 관련성에 따라 다른 수준의 세부 사항으로 유지됩니다. 이 원칙을 실용화하기 위해, 추론, 컨텍스트 관리, 도구 사용을 통합된 루프에서 결합하는 탄성 컨텍스트 오케스트레이션을 위한 일반적인 에이전트 패러다임인 Context-ReAct 을 소개합니다. Context-ReAct 은 Skip, Compress, Rollback, Snippet, Delete 라는 5 가지 원자 연산을 제공하여 에이전트가 작업 컨텍스트를 동적으로 재구성할 수 있게 합니다: 중요한 증거를 보존하고, 해결된 정보를 요약하며, 도움이 되지 않는 분지를 제거하고, 컨텍스트 크기를 제어합니다. 우리는 Compress 연산자가 표현력 완전성을 증명했으며, 다른 전문화된 연산자는 비용 감소와 환각 위험을 줄이는 효율성과 충실성 보장을 제공합니다. 이 패러다임을 바탕으로, LongSeeker 를 개발했습니다: Qwen3-30B-A3B 에서 10k 합성 궤적에 세밀 조정된 장기 지평 검색 에이전트입니다. 네 가지 대표적인 검색 벤치마크에서 LongSeeker 는 BrowseComp 에서 61.5%, BrowseComp-ZH 에서 62.5% 를 달성하여 Tongyi DeepResearch (43.2% 및 46.7%) 와 AgentFold (36.2% 및 47.3%) 를 현저히 상회했습니다. 이러한 결과는 적응적 컨텍스트 관리의 잠재력을 보여주며, 에이전트가 작업 기억을 능동적으로 형성함으로써 더 신뢰할 수 있고 효율적인 장기 지평 추론을 달성할 수 있음을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

LongSeeker: 장기 지평 검색 에이전트를 위한 탄성 컨텍스트 오케스트레이션

요약

핵심 포인트

댓글