저장은 기억이 아닙니다: 에이전트 회상을 위한 검색 중심 아키텍처

수집 단계에서의 추출은 에이전트 기억에 대한 잘못된 기본 요소입니다: 쿼리가 알려지기 전에 폐기된 콘텐츠는 검색 시점에 복구할 수 없습니다. 우리는 True Memory 를 제안하며, 이는 시스템의 중심을 저장 스키마에서 정문으로 보존된 이벤트에 대해 작동하는 다단계 검색 파이프라인으로 이동합니다. 전체 시스템은 외부 데이터베이스, 벡터 인덱스, 그래프 스토어, 또는 GPU 없이 상용 CPU 에서 단일 SQLite 파일로 실행됩니다.

LoCoMo(10 개의 멀티 세션 대화에서 1,540 개의 질문) 에 대해 True Memory Pro 는 매칭된 gpt-4.1-mini 답변 모델에 대해 93.0% 정확도 (3-run 평균) 를 달성하며, 이는 Mem0(61.4%), Supermemory(65.4%), Zep(약 71%), EverMemOS(94.5%) 보다 높습니다. LongMemEval(500 개의 질문) 에 대해 True Memory Pro 는 87.8%(3-run 평균) 를 달성합니다. BEAM-1M(100 만 토큰 규모에서 700 개의 질문) 에 대해 True Memory Pro 는 76.6%(3-run 평균) 를 달성하며, 이는 Hindsight 의 이전 출판된 결과인 73.9% 보다 높습니다. 56 개 구성의 아벨레이션은 상위 성능을 가진 구성 가족 내에서 1.3 퍼센트 포인트의 분포를 보여줍니다.

Insights

저장은 기억이 아닙니다: 에이전트 회상을 위한 검색 중심 아키텍처

요약

핵심 포인트

댓글

AI 에이전트를 실행하는 데 실제로 드는 비용은 얼마인가?

GitHub, Issues를 위한 에이전트 자동화 제어 기능 출시

D200X를 위한 Vibe Deck — Ulanzi D200X를 AI 코딩 에이전트용 커맨드 데크로 변신시키기

Windowed-MTP: 백만 토큰 컨텍스트에서 Full-Context Draft-KV 비용 제거하기

AI 에이전트를 실행하는 데 실제로 드는 비용은 얼마인가?

GitHub, Issues를 위한 에이전트 자동화 제어 기능 출시

D200X를 위한 Vibe Deck — Ulanzi D200X를 AI 코딩 에이전트용 커맨드 데크로 변신시키기

Windowed-MTP: 백만 토큰 컨텍스트에서 Full-Context Draft-KV 비용 제거하기