본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 07. 17:26

저장은 기억이 아닙니다: 에이전트 회상을 위한 검색 중심 아키텍처

요약

본 기술 기사는 에이전트 기억 시스템에 대한 기존 접근 방식의 한계를 지적하며, 'True Memory'라는 새로운 검색 중심 아키텍처를 제안합니다. True Memory는 저장 스키마 대신 정문(event)에 초점을 맞춘 다단계 검색 파이프라인을 사용하여, 쿼리가 발생하기 전에 폐기되는 콘텐츠 손실 문제를 해결합니다. 이 시스템은 단일 SQLite 파일로 상용 CPU에서 실행 가능하며, 다양한 대화 및 장기 기억 평가 벤치마크에서 기존의 최신 모델들보다 높은 성능을 입증했습니다.

핵심 포인트

  • 에이전트 기억 시스템은 단순히 콘텐츠를 저장하는 것이 아니라, 검색 중심 아키텍처가 필요하다는 점을 강조합니다.
  • 제안된 'True Memory'는 저장 스키마 대신 정문(event) 기반의 다단계 검색 파이프라인을 사용하여 정보 손실 문제를 해결합니다.
  • 시스템은 외부 데이터베이스나 GPU 없이 단일 SQLite 파일로 상용 CPU 환경에서 구동될 수 있어 접근성이 높습니다.
  • 다양한 벤치마크(LoCoMo, LongMemEval, BEAM-1M) 테스트 결과, True Memory는 기존의 최고 성능 모델들보다 일관되게 높은 정확도를 달성했습니다.

수집 단계에서의 추출은 에이전트 기억에 대한 잘못된 기본 요소입니다: 쿼리가 알려지기 전에 폐기된 콘텐츠는 검색 시점에 복구할 수 없습니다. 우리는 True Memory 를 제안하며, 이는 시스템의 중심을 저장 스키마에서 정문으로 보존된 이벤트에 대해 작동하는 다단계 검색 파이프라인으로 이동합니다. 전체 시스템은 외부 데이터베이스, 벡터 인덱스, 그래프 스토어, 또는 GPU 없이 상용 CPU 에서 단일 SQLite 파일로 실행됩니다.

LoCoMo(10 개의 멀티 세션 대화에서 1,540 개의 질문) 에 대해 True Memory Pro 는 매칭된 gpt-4.1-mini 답변 모델에 대해 93.0% 정확도 (3-run 평균) 를 달성하며, 이는 Mem0(61.4%), Supermemory(65.4%), Zep(약 71%), EverMemOS(94.5%) 보다 높습니다. LongMemEval(500 개의 질문) 에 대해 True Memory Pro 는 87.8%(3-run 평균) 를 달성합니다. BEAM-1M(100 만 토큰 규모에서 700 개의 질문) 에 대해 True Memory Pro 는 76.6%(3-run 평균) 를 달성하며, 이는 Hindsight 의 이전 출판된 결과인 73.9% 보다 높습니다. 56 개 구성의 아벨레이션은 상위 성능을 가진 구성 가족 내에서 1.3 퍼센트 포인트의 분포를 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0