Ghost Tool Calls: 추측적 에이전트 도구의 호출 시점 프라이버시
요약
도구 증강 에이전트가 지연 시간을 줄이기 위해 수행하는 추측적 도구 호출이 사용자 의도를 외부로 유출하는 'Ghost Tool Calls' 문제를 다룹니다. 이를 해결하기 위해 호출 시점에 정책을 적용하는 '추측적 도구 프라이버시 계약'이라는 새로운 런타임 추상화를 제안합니다.
핵심 포인트
- 추측적 도구 호출은 확정 전 사용자 의도를 외부로 유출함
- 기존의 사후 필터링이나 권한 제어로는 유출된 정보를 되돌릴 수 없음
- Ghost Tool Calls 문제를 해결하기 위한 새로운 프라이버시 계약 제안
- 호출 시점에 인자나 목적지를 변경하는 정책이 가장 효과적임
도구 증강 언어 에이전트(Tool-augmented language agents)는 지연 시간(latency)을 숨기기 위해 향후 발생할 가능성이 높은 도구 호출(tool calls)을 추측적으로 실행하지만, 이러한 호출은 에이전트가 해당 분기(branch)를 확정(commit)하기 전에 외부 서비스로 추론된 사용자 의도(user intent)를 유출합니다. 호출을 수신한 모든 외부 관찰자(external observer)는 에이전트가 해당 분기를 포기한 후에도 해당 정보를 보유하게 됩니다. 문제는 권한(authorization)이 아니라 타이밍(timing)입니다. 확정 시점의 정리(commit-time cleanup), 읽기 전용 제한(read-only restriction), 또는 액세스 제어 허용 목록(access-control allow-list)은 관찰자가 이미 보유한 정보를 되돌릴 수 없습니다. 우리는 이러한 호출을 Ghost Tool Calls라고 명명하며, 확정 전의 관찰을 상태 변이(state mutation)와 구별되는 일급 효과(first-class effect)로 취급하는 런타임 추상화인 추측적 도구 프라이버시 계약(Speculative Tool Privacy Contracts)을 제안합니다. 우리는 프로토타입 런타임에 이 계약을 구현하고 세 개의 코퍼스(corpora)에 걸쳐 12개의 정책을 평가했습니다. 추측적 디스패치(Speculative dispatch)는 관찰자가 사용자 의도에 대해 추론할 수 있는 내용을 증가시킵니다. 사후 필터(post-hoc filters), 읽기 전용 제한, 액세스 제어 허용 목록은 해당 추론을 그대로 남겨둡니다. 오직 디스패치 전에 추측적 호출의 인자(argument) 또는 목적지 투영(destination projection)을 변경하거나 억제하는 호출 시점 정책(issue-time policies)만이 이를 감소시킵니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기