GIST-CMTF: LLM 에이전트를 위한 인과적 최소 도구 필터링을 위한 목표 상태 추론
요약
LLM 에이전트가 모호한 사용자 요청을 처리할 때 잘못된 목표를 실행하는 문제를 해결하기 위해 GIST-CMTF 프레임워크를 제안합니다. 이 모델은 목표 상태를 추론하여 인과적으로 필요한 도구만을 필터링함으로써 태스크 성공률을 높이고 잘못된 실행을 대폭 줄입니다.
핵심 포인트
- 모호한 요청으로 인한 에이전트의 잘못된 목표 실행 문제 해결
- GIST-CMTF를 통해 후보 기호적 목표를 예측하고 모호성 추정
- 기존 CMTF 대비 태스크 성공률 97.0% 달성
- 잘못된 목표 실행률을 19.4%에서 2.5%로 크게 감소
- 도구 관련성뿐만 아니라 목표 상태 검증의 중요성 강조
도구 증강 LLM 에이전트(Tool-augmented LLM agents)는 각 단계에서 어떤 도구가 보여야 할지를 결정하기 위해 런타임 필터링(runtime filtering)에 의존합니다. 인과적 최소 도구 필터링 (Causal Minimal Tool Filtering, CMTF)은 인과적으로 필요한 다음 도구 프런티어(frontier)만을 노출함으로써 도구 선택의 혼란을 줄이지만, 이는 사용자 요청이 이미 기호적 목표 상태(symbolic goal state)로 매핑되었다고 가정합니다. 실제로 "내 약속을 처리해줘" 또는 "이 이메일을 처리해줘"와 같은 요청은 여러 가지 가능한 목표에 대응할 수 있습니다. 이는 에이전트가 의도하지 않은 목적을 위해 유효한 인과적 도구 경로를 따르는 잘못된 목표 실행(wrong-goal execution)을 초래합니다. 우리는 CMTF에서 사용하는 것과 동일한 상태 전이 어휘(state-transition vocabulary)를 사용하여 후보 기호적 목표를 예측하고, 모호성을 추정하며, CMTF를 적용하거나 누락된 목표 또는 상태 변수를 생성하는 인과적 행동으로서 명확화(clarification)를 노출하는 목표 상태 추론 계층인 GIST-CMTF를 소개합니다. 우리는 7개의 모델 백엔드, 6개의 필터링 방법, 120개의 통제된 도구 사용 태스크에 대해 GIST-CMTF를 평가했습니다. GIST-CMTF는 top-goal CMTF의 80.1%, semantic-goal CMTF의 82.9%와 비교하여 97.0%의 태스크 성공률을 달성했습니다. 이는 top-goal CMTF 하에서의 19.4%였던 잘못된 목표 실행을 2.5%로 줄이는 동시에, 인과적 필터링의 단일 도구 노출 특성을 유지하며 모든 도구를 노출하는 방식보다 훨씬 적은 토큰을 사용합니다. 이러한 결과는 신뢰할 수 있는 도구 증강 에이전트가 외부 행동을 노출하기 전에 도구의 관련성뿐만 아니라 목표 상태를 검증해야 함을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기