본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 17. 12:28

LLM 에이전트를 위한 구성적 기술 라우팅: 분해, 검색 및 구성

요약

복잡한 작업을 수행하기 위해 여러 기술을 조합하는 '구성적 기술 라우팅' 문제를 해결하기 위한 SkillWeaver 프레임워크를 제안합니다. 작업 분해, 기술 검색, 계획 구성을 결합하여 LLM 에이전트의 도구 활용 능력을 극대화합니다.

핵심 포인트

  • SkillWeaver: 분해-검색-구성을 결합한 에이전트 프레임워크
  • CompSkillBench: MCP 서버 기술을 활용한 300개의 구성적 쿼리 벤치마크 도입
  • SAD(Skill-Aware Decomposition): 반복적 피드백을 통해 작업 분해 정확도 대폭 향상
  • 컨텍스트 윈도우 소비를 99% 이상 절감하며 높은 일반화 성능 확인

LLM 에이전트들은 재사용 가능한 도구 사양인 외부 기술(external skills)에 점점 더 의존하고 있지만, 실제 세계의 작업들은 단순히 하나의 기술을 선택하는 것이 아니라 여러 기술을 구성하는 것을 요구하는 경우가 많습니다. 우리는 이를 구성적 기술 라우팅(Compositional Skill Routing) 문제로 공식화합니다. 즉, 복잡한 사용자 쿼리와 대규모 기술 라이브러리가 주어졌을 때, 쿼리를 원자적 하위 작업(atomic sub-tasks)으로 분해하고, 각 하위 작업에 적합한 기술을 검색하며, 실행 가능한 계획을 구성하는 것입니다. 우리는 LLM 작업 분해기(task decomposer), FAISS 인덱싱을 사용하는 바이-인코더(bi-encoder) 기술 검색기, 그리고 의존성 인식 DAG 플래너(dependency-aware DAG planner)를 결합한 분해-검색-구성 프레임워크인 SkillWeaver를 제시합니다. 평가를 지원하기 위해, 우리는 공개 MCP 생태계에서 가져온 24개의 기능 카테고리에 걸쳐 2,209개의 실제 MCP 서버 기술을 포함하는 300개의 구성적 쿼리 벤치마크인 CompSkillBench를 도입합니다. 우리의 실험 결과, 작업 분해(task decomposition) 품질이 주요 병목 구간임을 밝혀냈습니다. 표준 LLM 분해는 단계 수준에서 카테고리 재현율(category recall)이 34.2%에 불과합니다. 이를 해결하기 위해, 우리는 분해를 사용 가능한 기술과 반복적으로 정렬하는 검색 증강 피드백 루프인 반복적 기술 인식 분해(Iterative Skill-Aware Decomposition, SAD)를 제안합니다. SAD는 단 한 번의 반복만으로 분해 정확도를 51.0%에서 67.7%로 향상시켰습니다 (+32.7%, Wilcoxon p < 10^-6). DA(Dependency Awareness) 조건부 분석은 올바른 입도(granularity)가 효과적인 검색을 위한 전제 조건임을 확인해 줍니다 (DA=1일 때 CatR@1이 34%에서 41%로 상승). SkillWeaver는 컨텍스트 윈도우(context window) 소비를 99% 이상 줄이며, 전이 실험(transfer experiments)을 통해 일반화 성능을 확인했습니다 (대상 카테고리가 검색 풀에 없는 경우에도 상대적 DA 이득이 +35.6% 발생).

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0