회상을 넘어선 기억: 자기 진화형 LLM 에이전트를 위한 이중 프로세스 인지 기억 시스템
요약
LLM 에이전트의 장기 기억을 위해 이중 프로세스 인지 기억 시스템인 DCPM을 제안합니다. 이 시스템은 동기식 주간 작성기(System1)와 비동기식 야간 엔진(System2)을 통해 신념 수정과 고차원 스키마 추상화를 수행합니다.
핵심 포인트
- DCPM은 인지 능력 계층에 따라 기억을 재구성함
- System1은 신념 수정을 기록하는 동기식 프로세스임
- System2는 스키마와 의도를 유도하는 비동기식 엔진임
- PersonaMem-v2 벤치마크에서 세션 간 추론 성능 향상 입증
LLM 에이전트(LLM agent)를 위한 장기 기억(Long-term memory)은 단순히 적절한 시점에 적절한 구절을 검색하는 것 그 이상을 의미합니다. 현재의 기억 시스템은 신념 수정(belief revision), 인과적 결합(causal coupling), 그리고 도메인 간 추상화(cross-domain abstraction)를 표면적 회상(surface recall)에 맞춰 조정된 단일 검색 인터페이스로 통합해 버리며, 결과적으로 사용자가 어떻게 변화해 왔는지에 대한 추론을 요구하는 암시적 개인화(implicit personalisation) 작업에 어려움을 겪습니다. 우리는 원시 입력(raw inputs)과 원자적 사실(atomic facts)로부터 시작하여, 통시적 신념 궤적(diachronic belief trajectories)과 정체성(identity)을 거쳐, 도메인 스키마(domain schemas), 잠재적 의도(latent intentions) 및 도메인 간 패턴(cross-domain patterns)으로 상승하는 인지 능력 계층에 따라 에이전트의 기억을 재구성하는 DCPM을 제안합니다. 이 계층 구조는 이중 프로세스 이론(dual-process theory)의 구조적 분리를 계승하는 두 가지 프로세스에 의해 구동됩니다. 즉, 신념 수정을 이중 연결된 상위 대체 체인(doubly linked supersedes chains)으로 기록하는 동기식 주간 작성기(System1)와, 스키마 및 의도를 유도하고 고차원 핵심 스키마(core schemas)로 추상화된 도메인 간 충돌(cross-domain collisions)을 탐색하는 비동기식 야간 엔진(System2)입니다. LongMemEval, PersonaMem 및 PersonaMem-v2 벤치마크에서 System2를 활성화하는 것은 암시적 세션 간 추론(implicit cross-session inference)에 보상을 주는 항목에서 가장 큰 기여를 했으며(PersonaMem-v2에서 최대 +5.20), 구간 회상(span recall)에서는 가장 적은 기여를 하여 구조적 예측과 일치하는 결과를 보였습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기