arXiv논문2026. 06. 15. 03:48

HyperTool: 단계별 도구 호출을 넘어선 도구 증강 에이전트를 위한 방법

요약

본 논문은 기존 LLM 에이전트가 겪는 '실행 정밀도 불일치' 문제를 해결하기 위해 HyperTool이라는 새로운 도구 인터페이스를 제안합니다. HyperTool은 여러 단계의 도구 호출 및 데이터 처리를 단일 외부 호출로 접어 넣어 모델에게 더 간결하고 효율적인 추론 과정을 제공합니다. 이를 통해 다단계 도구 사용 능력을 크게 향상시켰습니다.

핵심 포인트

HyperTool은 기존 에이전트의 '실행 정밀도 불일치' 문제를 해결함.
여러 단계의 도구 워크플로우를 단일 외부 호출로 '접어 넣는(folding)' 방식을 사용함.
MCP-Universe 환경에서 Qwen3 모델들의 정확도를 크게 향상시킴.
GPT-OSS와 Kimi-k2.5 등 기존 모델 대비 우수한 성능을 입증함.

도구가 증강된 LLM 에이전트는 일반적으로 단계별 원자적(atomic) 도구 호출에 의존하며, 여기서 각 호출, 관찰 및 값 전송은 주 추론 과정(reasoning trace)에 노출됩니다. 이는 extit{실행 정밀도 불일치}(execution-granularity mismatch)를 초래합니다: 국소적으로 결정론적인(deterministic) 도구 워크플로우가 반복되는 모델 가시적 결정으로 전개되어 컨텍스트를 소모하고, 모델이 추적 과정에서 저수준 데이터 흐름을 관리하도록 강요합니다. 우리는 도구 실행의 모델 가시적 단위를 변경하는 통합 실행 가능한 MCP 스타일의 도구 인터페이스인 extbf{HyperTool}을 소개합니다. 모델은 기존 스키마를 통해 기존 도구를 호출하고, 반환된 값을 조작하며, 중간 결과를 로컬로 전달할 수 있는 코드 블록으로 HyperTool을 호출하여, 결정론적인 도구 서브루틴들을 단일 외부 호출로 접어 넣습니다(folding). 이 인터페이스를 사용하도록 모델을 훈련하기 위해, 우리는 교차 도구 구성 작업(cross-tool compositional tasks)으로부터 HyperTool 형식의 궤적(trajectories)을 합성하고 실제 MCP 환경에서 검증합니다. MCP-Universe에서 HyperTool은 Qwen3-32B의 평균 정확도를 15.69%에서 35.29%로, 그리고 Qwen3-8B의 평균 정확도를 9.93%에서 33.33%로 향상시키며, GPT-OSS와 Kimi-k2.5를 능가하는 평균 정확도를 보여주어, 우리의 HyperTool이 다단계 도구 사용을 실질적으로 개선할 수 있음을 입증합니다.

AI 자동 생성 콘텐츠

원문 바로가기

HyperTool: 단계별 도구 호출을 넘어선 도구 증강 에이전트를 위한 방법

요약

핵심 포인트

댓글