본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 18. 20:02

효율적인 장기 에이전트 메모리를 위한 차원 구조화 프레임워크 DimMem

요약

DimMem은 LLM 에이전트의 장기 메모리 효율성을 높이기 위해 시간, 장소, 목적 등 명시적 필드를 사용하는 차원 구조화 프레임워크입니다. 이 방식은 기존의 평면적인 요약 방식보다 정확한 정보 회상을 가능하게 하며, 토큰 비용을 절감하면서도 높은 성능을 유지합니다. 특히 소형 모델을 미세 조정하여 대규모 모델에 필적하는 메모리 추출 성능을 구현할 수 있음을 입증했습니다.

핵심 포인트

  • 메모리를 시간, 장소, 이유, 목적, 키워드 등 명시적 필드를 가진 원자적 단위로 구조화하여 차원 인식 검색 지원
  • LoCoMo-10 및 LongMemEval-S 벤치마크에서 높은 정확도를 달성하며 기존 경량 메모리 시스템 능가
  • LoCoMo 벤치마크 기준 쿼리당 토큰 비용을 24% 절감하여 효율성 증대
  • Qwen3-4B와 같은 소형 모델을 DimMem 스키마로 미세 조정하여 GPT-4.1-mini 기반 시스템보다 우수한 추출 성능 확보

대규모 언어 모델 (LLM) 에이전트는 과거 상호작용으로부터 정보를 활용하기 위해 장기 메모리 (Long-term memory)가 필요합니다. 그러나 기존의 메모리 시스템은 종종 충실도와 효율성 사이의 트레이드오프 (Fidelity--efficiency trade-off) 문제에 직면합니다. 즉, 가공되지 않은 대화 기록 (Raw dialogue histories)은 비용이 많이 들며, 평면적인 사실 (Flat facts)이나 요약본은 정확한 회상을 위해 필요한 구조를 누락할 수 있습니다. 본 논문에서는 각 메모리를 시간, 장소, 이유, 목적, 키워드와 같은 명시적인 필드를 가진 원자적이고, 유형화되었으며, 독립적인 단위로 표현하는 경량 차원 메모리 프레임워크인 \textbf{DimMem}을 제안합니다. 이러한 표현 방식은 모델 컨텍스트 (Model context)에 전체 기록을 저장하지 않고도 차원 인식 검색 (Dimension-aware retrieval), 메모리 업데이트, 그리고 선택적 어시스턴트 컨텍스트 회상 (Selective assistant-context recall)에 필요한 구조를 드러냅니다. LoCoMo-10 및 LongMemEval-S 벤치마크 전반에 걸쳐 DimMem은 각각 \textbf{81.43%}와 \textbf{78.20%}의 전체 정확도를 달성하였으며, 이는 기존의 경량 메모리 시스템을 능가하는 동시에 LoCoMo의 쿼리당 토큰 비용을 \textbf{24%} 절감한 결과입니다. 나아가 우리는 차원 메모리 추출 (Dimensional memory extraction)이 소형 모델에 의해서도 학습 가능하다는 것을 보여줍니다. DimMem 스키마 (Schema)로 미세 조정 (Fine-tuning)을 거친 Qwen3-4B 추출기는 두 벤치마크 모두에서 GPT-4.1-mini를 사용한 LightMem보다 우수한 성능을 보였으며, 주요 설정에서 훨씬 더 큰 규모의 추출기와 대등하거나 더 나은 성능에 도달했습니다. 이러한 결과는 명시적인 차원 구조화가 LLM 에이전트의 장기 메모리를 위한 효과적이고 효율적인 기반임을 시사합니다. 코드는 https://github.com/ChowRunFa/DimMem 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0