AdaMem: 개인화된 장기적 LLM 에이전트를 위해 무엇을 기억할지 학습하기
요약
LLM 에이전트의 메모리 팽창 문제를 해결하기 위해 무엇을 기억할지 학습하는 AdaMem 방법론을 제안합니다. 사용자의 역할에 따라 기억할 정보를 선별하는 쓰기 제어 메커니즘을 통해 메모리 효율성과 QA 정확도를 동시에 높였습니다.
핵심 포인트
- 무분별한 정보 저장이 아닌 역할 기반의 쓰기 제어(Write Control) 제안
- 자기 성찰(Self-reflection)과 실패 롤백을 통한 메모리 정책 정교화
- AdaMem-Bench 구축을 통한 장기적 상호작용 시뮬레이션 검증
- 기존 Mem0 대비 QA 정확도 최대 9% 향상 및 메모리 용량 9% 절감
대규모 언어 모델 (LLM) 에이전트를 위한 장기 기억 (Long-term memory) 시스템은 일반적으로 가능한 한 많은 사실을 유지하기 위해 기억을 균일하게 추출하며, extit{모든 것을 기억하려고} 시도합니다. 그러나 실제 서비스 환경에서는 추론 비용 (inference cost)과 제한된 컨텍스트 예산 (context budgets)으로 인해 이러한 방식은 유지하기 어렵습니다. 원시 대화 (raw dialogue)를 기억으로 통합하는 것을 넘어, 에이전트는 각 사용자가 실제로 관심을 갖는 정보만을 효율적으로 유지하는 extit{쓰기 제어 (write control)}를 수행해야 합니다. 그렇지 않으면, 장기적인 개인화 상호작용은 무관한 잡다한 정보가 유용한 정보를 밀어내고 질의응답 (QA) 정확도를 지속적으로 떨어뜨리는 extit{메모리 팽창 (memory bloat)} 문제를 겪게 됩니다. 우리는 기억할 가치가 있는 것이 역할에 따라 달라진다고 주장하며, 피드백을 통해 각 사용자별로 extit{무엇을 기억할지 학습하는} 방법론인 extbf{AdaMem} (Adaptive Memory)을 제안합니다. AdaMem은 구조화된 역할별 메모리 정책 (Memory Policy)을 유지하며, 실패 롤백 (failure rollback) 기능이 포함된 경량 패치 스타일의 자기 성찰 (self-reflection) 단계를 통해 매주 발생하는 QA 피드백으로부터 이를 정교화합니다. 이 설정을 연구하기 위해, 우리는 주 단위 QA를 포함하여 수 주간의 상호작용을 시뮬레이션하는 벤치마크인 extbf{AdaMem-Bench}를 구축했습니다. 두 가지 추출 모델과 두 가지 피드백 모드에 걸쳐, AdaMem은 균일한 Mem0 베이스라인 대비 QA 정확도를 최대 extbf{+9.0%} 향상시키는 동시에 메모리 용량을 extbf{9%} 줄였습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기