NTILC: 학습된 압축을 통한 신경망 도구 호출 (Neural Tool Invocation via Learned Compression)
요약
NTILC는 대규모 도구 레지스트리를 사용하는 에이전트 모델의 컨텍스트 소모와 지연 시간 문제를 해결하기 위한 새로운 프레임워크입니다. 학습된 잠재 검색을 통해 도구 사양을 임베딩 공간으로 매핑하여 효율적인 도구 선택과 호출을 가능하게 합니다.
핵심 포인트
- 인컨텍스트 조회를 학습된 잠재 검색으로 대체
- 컨텍스트 토큰 사용량 95% 이상 절감
- 추론 지연 시간 최대 74% 감소
- 시그니처 인식 복합 목적 함수를 통한 정밀한 도구 선택
에이전트 기반 도구 호출 언어 모델 (Agentic tool-calling language models)은 호출 가능한 API, 함수 및 로컬 액션의 대규모 레지스트리 (registries)에 의존합니다. 전체 도구 사양 (tool specifications)을 프롬프트에 직접 배치하는 것은 도구 레지스트리의 크기에 따라 선형적으로 증가하는 비용을 발생시키며, 컨텍스트 예산 (context budget)을 빠르게 소모합니다. 레지스트리가 커짐에 따라 이는 높은 지연 시간 (latency)을 초래하고, 특히 관련 없는 도구들로부터 발생하는 간섭으로 인해 선택 정확도 (selection accuracy)를 저하시킵니다. 우리는 인컨텍스트 레지스트리 조회 (in-context registry look-up)를 학습된 잠재 검색 (learned latent retrieval)으로 대체하는 신경망 도구 선택 및 호출 프레임워크인 NTILC를 도입하여 이러한 한계를 극복합니다. NTILC는 사용자 의도 (user intent)와 도구 사양을 공유 임베딩 공간 (shared embedding space)으로 매핑하여, 인컨텍스트 조회 대신 외부 검색 (external retrieval)을 통한 도구 선택을 가능하게 합니다. 언어 모델은 선택된 도구 스키마 (tool schema)에만 조건화되어, 정밀하고 제약된 인자 생성 (argument generation)을 수행할 수 있습니다. 우리 접근 방식의 핵심은 시그니처 인식 복합 목적 함수 (signature-aware composite objective)로, 이는 도구 시그니처 (tool signatures, 예: 인자 스키마, 타입 호환성 및 반환 타입)에서 유도된 제약 조건을 의미론적 유사성 (semantic similarity)과 결합합니다. Circle Loss와 기능적 마진 손실 (Functional Margin Loss)을 결합함으로써, 모델은 의미론적으로는 유사하지만 실행 시그니처상으로는 호환되지 않는 도구들 사이의 분리를 강제합니다. 우리는 공개된 도구 선택 및 함수 호출 데이터셋에서 NTILC를 평가하고 컨텍스트 토큰 사용량, 검색 정확도 및 선택 지연 시간 지표를 보고합니다. 이러한 설정 전반에서 NTILC는 롱 컨텍스트 ICT 베이스라인 (long-context ICT baselines)과 비교하여 컨텍스트 창 소모를 95% 이상 줄이고 추론 지연 시간을 최대 74%까지 감소시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv Codex (cs.SE)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기