arXiv논문2026. 06. 02. 10:48

SkillPager: 의미론적 노드 검색을 통한 쿼리 적응형 기술 내 탐색 (Query-Adaptive Intra-Skill

요약

LLM 에이전트의 효율적인 기술 문서 활용을 위해 의미론적 노드 기반의 2단계 검색 프레임워크인 SkillPager를 제안합니다. 이 방식은 토큰 사용량을 47.04% 절감하면서도 높은 컨텍스트 충분성을 유지하여 에이전트의 실행 효율을 극대화합니다.

핵심 포인트

의미론적 노드 파싱을 통한 2단계 검색 프레임워크 제안
MMR을 활용한 쿼리 조건부 노드 선택 방식 도입
프롬프트 토큰 사용량 47.04% 절감 달성
고정 길이 청크 대비 높은 비용 효율성 입증
유형화된 문서 내 검색의 중요성 식별

기술 기반의 LLM 에이전트 (LLM agents)들은 점점 더 긴 절차적 문서에 의존하고 있지만, 문서 전체를 프롬프트로 사용하는 방식은 토큰을 낭비하고 실행에 중요한 정보를 희석시킵니다. 우리는 이를 기술 내 검색 (intra-skill retrieval) 설정으로 연구하며, 여기서의 목표는 주어진 쿼리에 대해 알려진 기술 문서로부터 실행에 충분한 최소한의 컨텍스트 (context)를 선택하는 것입니다. 우리는 각 Markdown 기술을 오프라인에서 유형화된 의미론적 노드 (semantic nodes)로 파싱하고, 온라인에서 전역적이고 쿼리 조건부인 노드 선택을 수행하기 위해 최대 한계 관련성 (Maximal Marginal Relevance, MMR)을 활용하는 2단계 프레임워크인 SkillPager를 제안합니다. 395개의 기술과 1,975개의 쿼리로 구성된 벤치마크에서, SkillPager는 프롬프트 토큰을 47.04% 줄이면서도, 전체 문서를 모두 사용하는 베이스라인 (baseline)의 82.23%와 비교하여 LLM이 판단한 컨텍스트 충분성 (context sufficiency) 78.89%를 달성했습니다. 입도 (granularity)에 대한 절제 연구 (ablation) 결과, 가공되지 않은 고정 길이 청크 (fixed-length chunks)에 동일한 검색 알고리즘을 적용하면 81.77%라는 유사한 충분성에 도달하지만 토큰 비용이 28.81% 증가하는 것으로 나타났으며, 이는 효율성 향상이 검색 알고리즘 자체보다는 유형화된 의미론적 입도 (semantic granularity)에 의해 주도됨을 입증합니다. 그래프 기반 베이스라인들 중에서 SkillPager는 가장 강력한 베이스라인보다 12.16%의 차이로 성능이 뛰어납니다. 추가적인 절제 연구를 통해, 지원 콘텐츠는 정적 휴리스틱 (static heuristics)에 의해 제거되기보다 후보 풀 (candidate pool)에 유지되어 적응적으로 선택될 때 가장 효과적임을 보여줍니다. 이러한 결과는 유형화된 문서 내 검색 (typed intra-document retrieval)이 기술 기반 에이전트들에게 있어 별개의 접근 문제임을 식별합니다.

AI 자동 생성 콘텐츠

원문 바로가기

SkillPager: 의미론적 노드 검색을 통한 쿼리 적응형 기술 내 탐색 (Query-Adaptive Intra-Skill

요약

핵심 포인트

댓글