arXiv논문2026. 06. 03. 11:04

DMF: 대화형 AI 에이전트를 위한 결정론적 메모리 프레임워크

요약

대화형 AI 에이전트의 메모리 일관성을 위해 LLM 요약 대신 수학적 점수 산정 방식을 사용하는 결정론적 메모리 프레임워크(DMF)를 제안합니다. DMF는 로지스틱 투영과 생존 점수를 활용하여 토큰 비용을 획기적으로 줄이면서도 높은 정확도를 유지합니다.

핵심 포인트

LLM 기반 요약 대신 결정론적 수학 모델을 사용하여 비결정성 해결
생존 점수(Survival Score)를 통한 효율적인 메모리 가지치기 구현
기존 Mem0 대비 토큰 사용량을 최대 242배 절감
메모리 관리 루프에서 LLM 호출을 제거하여 비용을 거의 제로로 구현

대화형 AI 에이전트(Conversational AI agents)는 긴 상호작용 범위(interaction horizons)에 걸쳐 확장 가능하면서도 의미론적 일관성(semantically coherent)을 유지하는 메모리 시스템을 필요로 합니다. 기존 방식들은 주로 쓰기 시점(write time)에 대규모 언어 모델(LLM) 기반의 요약(summarisation)에 의존하는데, 이는 비결정성(non-determinism)을 유발하고, 토큰 비용을 상승시키며, 가지치기(pruning) 결정의 불투명성을 초래합니다. 본 논문에서는 생성적 메모리 압축(generative memory compression)을 고전적 자연어 처리(NLP) 분석, 벡터 기하학(vector geometry), 그리고 수학적 점수 산정(mathematical scoring)에 기반한 완전 결정론적 파이프라인으로 대체하는 CPU 우선 접근 방식인 결정론적 메모리 프레임워크(Deterministic Memory Framework, DMF)를 제시합니다. DMF는 각 대화 상호작용에 대해 결정론적 콘텐츠 신호, 대화 단서(conversational cues), 그리고 구조화된 출처(structured provenance)를 로지스틱 투영(logistic projection)을 통해 결합하여 계산된 생존 점수(Survival Score) $Ω$를 할당합니다. $Ω_{\mathrm{eff}}(Δn)$으로 표기되는 상호작용 횟수 쇠퇴 법칙(interaction-count decay law)은 새로운 턴(turn)이 도착함에 따라 관련성이 어떻게 진화하는지를 제어하며, 여기서 $Δn$은 실제 경과 시간(wall-clock time)이 아닌 더 새로운 상호작용의 수를 의미하여 완전한 결정론을 유지합니다. 우리는 DMF의 수학적 공식화, 구조화된 회상 파이프라인(structured recall pipeline), 가지치기 결정 절차, 그리고 평가 프로토콜을 제시합니다. 실험은 LoCoMo 및 LongMemEval 데이터셋을 사용하여 목적에 맞게 구축된 벤치마크에서 수행되었습니다. 우리는 DMF를 AI 에이전트를 위한 대중적인 메모리 레이어인 Mem0와 비교합니다. DMF는 메모리 컨텍스트를 준비하는 데 토큰을 전혀 사용하지 않으면서도 대등한 정확도를 달성하였으며, 전체 대화 동안 5배에서 242배 더 적은 토큰을 사용했습니다. 이러한 결과는 메모리 관리 루프에서 LLM 호출을 제거하여 토큰 비용을 거의 제로(zero)로 줄이고, 대화형 AI 에이전트를 위한 결정론적 메모리 시스템을 구현하는 것이 가능하다는 것을 보여줍니다.

AI 자동 생성 콘텐츠

원문 바로가기

DMF: 대화형 AI 에이전트를 위한 결정론적 메모리 프레임워크

요약

핵심 포인트

댓글