arXiv논문2026. 05. 26. 12:50

타입화된 메모리 표현 (Typed Memory Representation)을 통한 장기 에이전트의 출처-역할 붕괴

요약

LLM 에이전트의 장기 메모리 저장 방식에서 발생하는 출처-역할 붕괴 문제를 해결하기 위해 MemIR이라는 새로운 중간 표현 방식을 제안합니다. MemIR은 메모리를 구조화된 원자 단위로 기록하여 출처 모니터링 오류를 방지하고 정보의 신뢰성을 높입니다.

핵심 포인트

기존의 비구조화된 텍스트 저장 방식의 한계 지적
MemIR을 통한 근거 있는 원자 단위의 메모리 구조화
출처 추적 및 시간적 근거 설정 성능 향상
LoCoMo 및 BEAM-100K 벤치마크에서 우수한 성능 입증

장기 메모리 (Long-term memory)는 지속적인 LLM 에이전트 (LLM agents)에게 필수적이지만, 현재의 아키텍처 (architectures)는 과거의 상호작용을 구조화되지 않은 평면 텍스트 (unstructured, flat text)로 저장합니다. 이러한 제약 없는 저장 방식은 에이전트가 출처 모니터링 오류 (source-monitoring errors)를 겪게 되는 치명적인 실패 모드인 출처-역할 붕괴 (provenance-role collapse)를 유발합니다. 아키텍처 수준에서 이러한 인지적 취약성을 해결하기 위해, 우리는 출처 모니터링 (source monitoring)을 구조적 제약으로 실행하는 타입화된 메모리 중간 표현 (MemIR, Memory Intermediate Representation)을 제안합니다. MemIR은 원시 증거 (raw evidence), 검색 큐 (retrieval cues), 그리고 진실을 담은 주장 (truth-bearing claims)을 분리하는 근거 있는 원자 (grounded atoms) 단위로 장기 메모리를 기록하며, 사실적 권한 (factual authorization)은 지원되는 주장 원자 (claim atoms)로 제한됩니다. 그 후, 이질적인 검색 결과 (heterogeneous retrieval hits)를 주장 중심의 후보 번들 (claim-centered candidate bundles)과 답변 생성을 위한 정규화된 사실 인터페이스 (normalized fact interface)로 변환하기 위해 다중 경로 원자 투영 (multi-route atomic projection) 및 출처 범위 활용 (provenance-scoped utilization)을 적용합니다. LoCoMo 및 BEAM-100K에 대한 실험 결과, MemIR은 기존의 메모리 베이스라인 (memory baselines)보다 일관되게 우수한 성능을 보였으며, 특히 출처 추적 (source tracking), 시간적 근거 설정 (temporal grounding), 그리고 파편화된 증거의 집계 (aggregation of fragmented evidence)를 요구하는 작업에서 뛰어난 성능을 입증했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

타입화된 메모리 표현 (Typed Memory Representation)을 통한 장기 에이전트의 출처-역할 붕괴

요약

핵심 포인트

댓글