본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 01. 15:36

EviMem: 증거 격차 기반의 반복적 검색을 통한 장기 대화 기억

요약

EviMem은 장기 대화 기억을 위한 새로운 프레임워크로, 기존 검색 방법의 한계인 '증거 격차(evidence gap)'를 명시적으로 진단하여 쿼리 개선을 수행합니다. 이는 충분성 평가를 통해 누락된 정보를 파악하고 표적화된 질문 개선을 유도하는 폐쇄 루프 시스템입니다. EviMem은 특히 시간적 및 다단계 질문 처리에서 기존 방법 대비 높은 성능 향상을 보여주었으며, 관련 코드를 공개했습니다.

핵심 포인트

  • EviMem은 '증거 격차(evidence gap)' 개념을 도입하여, 검색 과정에서 누락된 정보를 명시적으로 진단합니다.
  • 이 프레임워크는 충분성 평가를 기반으로 폐쇄 루프 시스템을 구축하여 쿼리 개선의 정확도를 높입니다.
  • LaceMem과 결합되어 코어-파인(coarse-to-fine) 기억 계층 구조를 제공함으로써 미세한 격차 진단이 가능합니다.
  • LoCoMo 데이터셋 테스트 결과, 시간적 질문 및 다단계 질문 처리 능력이 기존 방법 대비 크게 향상되었습니다.

장기 대화 기억 (long-term conversational memory) 은 여러 세션에 흩어진 증거를 검색해야 하지만, 단회성 검색 (single-pass retrieval) 은 시간적 및 다단계 질문에서 실패합니다. 기존 반복적 방법들은 생성된 콘텐츠나 문서 수준 신호를 통해 쿼리를 개선하지만, 누적된 검색 세트에서 누락된 내용을 명시적으로 진단하는 '증거 격차 (evidence gap)'를 파악하지 못해 쿼리 개선을 표적화하지 못하게 합니다. 우리는 IRIS (Iterative Retrieval via Insufficiency Signals) 와 LaceMem (Layered Architecture for Conversational Evidence Memory) 을 결합한 EviMem 을 제시합니다. 이는 충분성 평가를 통해 증거 격차를 감지하고, 누락된 내용을 진단하며, 표적화된 쿼리 개선을 유도하는 폐쇄 루프 프레임워크입니다. 또한 미세한 격차 진단을 지원하는 코어에서 파인 (coarse-to-fine) 기억 계층 구조를 갖는 LaceMem 을 함께 제공합니다. LoCoMo 데이터셋에서 EviMem 은 MIRIX 대비 시간적 질문 (73.3% 에서 81.6% 로 향상) 과 다단계 질문 (65.9% 에서 85.2% 로 향상) 에서 Judge Accuracy 를 개선하며, 지연 시간을 4.5 배 줄였습니다. 코드: https://github.com/AIGeeksGroup/EviMem.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0