본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 12. 18:31

설명(Description)이 아닌 결정(Decision)을 기억하라: 에이전트 메모리를 위한 비트율-왜곡 프레임워크

요약

본 논문은 언어 에이전트의 메모리 시스템이 단순히 과거 경험을 '설명'하는 것을 넘어, 미래의 '결정'을 지원하기 위해 필요한 핵심 정보를 보존하는 데 초점을 맞춥니다. 기존 방식들이 관련성이나 요약 품질에 의존했던 것과 달리, 이 연구는 메모리를 결정 중심의 비트율-왜곡 문제로 재정의합니다. 이를 바탕으로 DeMem이라는 새로운 온라인 메모리 학습기를 제안하며, 이는 공유된 상태가 결정 충돌을 일으킬 때만 파티션을 개선하여 근사 최소-최대 후회(near-minimax regret)를 보장함으로써 에이전트 메모리의 효율성과 정확성을 크게 향상시킵니다.

핵심 포인트

  • 에이전트 메모리는 과거 경험의 설명적 재현보다 미래 결정 지원에 더 큰 가치를 지닌다.
  • 메모리 품질은 '결정 중심 비트율-왜곡' 문제로 정의되어, 압축으로 인한 결정 품질 손실을 측정한다.
  • 제안된 DeMem은 온라인 학습기이며, 공유 상태가 결정 충돌을 일으킬 때만 메모리를 개선하여 효율성을 높인다.
  • DeMem은 근사 최소-최대 후회(near-minimax regret)를 보장하며, 장기 대화 및 진단 환경에서 성능 향상을 입증했다.

장기적인 호흡의 언어 에이전트는 제한된 런타임 메모리 하에서 작동해야 합니다. 하지만 기존의 메모리 메커니즘들은 관련성(relevance), 두드러짐(salience) 또는 요약 품질과 같은 설명적 기준을 중심으로 경험을 구성하는 경우가 많습니다. 그러나 에이전트에게 있어 메모리는 과거를 충실하게 묘사하기 때문에 가치 있는 것이 아니라, 좋은 결정을 지원하기 위해 고정된 예산 하에서 분리되어야 하는 히스토리 간의 구분을 보존하기 때문에 가치가 있습니다. 우리는 이를 결정 중심의 비트율-왜곡(rate-distortion) 문제로 설정하고, 압축으로 인해 유발되는 달성 가능한 결정 품질 손실을 측정하여 메모리 품질을 측정합니다. 이는 안전하게 잊어버릴 수 있는 것에 대한 정확한 망각 경계와, 메모리 예산과 결정 품질 사이의 최적 트레이드오프를 특성화하는 메모리-왜곡(memory-distortion) 프론티어를 제공합니다. 이러한 결정 중심적인 메모리의 관점에 영감을 받아, 우리는 DeMem을 제안합니다. DeMem은 공유된 상태가 결정 충돌을 유발한다는 데이터가 인증할 때만 파티션을 개선하는 온라인 메모리 학습기이며, 근사 최소-최대 후회(near-minimax regret) 보장을 증명합니다. 통제된 합성 진단 환경과 장기적인 대화 벤치마크 모두에서 DeMem은 동일한 런타임 예산 하에 일관된 성능 향상을 보여주며, 메모리는 설명이 아닌 결정에 중요한 구분을 보존해야 한다는 원칙을 뒷받침합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
3

댓글

0