LLM 에이전트는 잠재적 컨텍스트 관리자이다: 자기 관리형 컨텍스트를 이끌어내는 고유 수용적 대시보드
요약
LLM 에이전트의 컨텍스트 관리 한계를 해결하기 위해, 모델의 내부 상태를 시각화하고 관리하는 VISTA 프레임워크를 제안합니다. VISTA는 학습 없이도 작업 기억을 블록 단위로 관리하여 Gemini 등 다양한 모델의 성능을 크게 향상시킵니다.
핵심 포인트
- LLM 에이전트의 컨텍스트 윈도우 병목 현상 해결
- VISTA: 학습이 필요 없는 모델 불가지론적 컨텍스트 관리 계층
- 작업 기억을 타입화된 블록으로 관리하는 런타임 대시보드 제공
- Gemini-1.5-Flash의 성능을 22.7%에서 50.7%로 대폭 개선
- 컨텍스트 압박이 커질수록 성능 향상 폭이 증가하는 특성
장기적 작업(Long-horizon)을 수행하는 도구 에이전트(tool agents)는 컨텍스트 윈도우(context window)의 한계에 도달함에 따라 컨텍스트가 어떻게 성장하는지에 의해 병목 현상을 겪습니다. 최근의 시스템들은 컨텍스트 관리를 에이전트 또는 시스템이 제어하도록 만들었지만, 이들은 증거를 폐기하는 압축 정책(compression policy)을 학습하거나 에이전트가 전혀 볼 수 없는 계층에서 컨텍스트를 관리합니다. 우리는 이 두 방식 모두 더 근본적인 격차를 해결하지 못한 채 남겨둔다고 주장합니다. 최첨단 언어 모델(Frontier language models)은 자신의 컨텍스트에 대해 고유 수용적(proprioceptively)으로 눈이 멀어 있습니다. 프롬프트(prompt)만으로는 각 블록이 얼마나 큰지, 얼마나 오래되었는지, 또는 얼마나 사용되었는지와 같은 '유지 또는 삭제(keep-or-drop)' 결정을 내리는 데 필요한 신호들을 볼 수 없습니다. 우리는 유능한 컨텍스트 관리가 이미 유능한 모델 내에 잠재되어 있으며, 부족한 것은 학습된 정책이 아니라 이 상태를 노출하는 인터페이스(interface)라고 가설을 세웁니다. 우리는 VISTA (Visible Internal State for Tool Agents)를 소개합니다. 이는 작업 기억(working memory)을 타입화되고 주소 지정이 가능한 블록(typed, addressable blocks)으로 표현하고, 블록별 토큰 사용량, 최신성(recency), 액세스 이력(access history)을 보여주는 런타임 대시보드(runtime dashboard)를 표면화하며, 블록을 복구 가능한 완전한 충실도의 페이로드(full-fidelity payloads)로 아카이브(archive)하는, 학습이 필요 없는(training-free) 모델 불가지론적(model-agnostic) 계층입니다. LOCA-Bench, BrowseComp-Plus, GAIA 벤치마크에서 동일한 미학습 인터페이스가 100만, 10만, 1만 규모의 궤적(trajectories)에 걸쳐 전이(transfer)됩니다. LOCA-Bench에서 이는 4개의 백본(backbones)을 개선하며, Gemini-3-Flash의 성능을 22.7%에서 50.7%로 끌어올립니다. 이러한 성능 향상은 컨텍스트 압박(context pressure)이 커질수록 증가하며 백본 간에도 전이됩니다. 절제 연구(Ablations)를 통해 대시보드가 아카이브 및 복구 도구 이상의 역할을 한다는 점을 추가로 확인했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기