arXiv논문2026. 05. 26. 12:50

사실에서 통찰로: 역할 수행 에이전트를 위한 페르소나 기반 이중 메모리 프레임워크 및 데이터셋

요약

역할 수행 에이전트의 페르소나 충실도를 높이기 위해 사실적 인지와 페르소나 기반 통찰을 분리한 DualMem 프레임워크를 제안합니다. 새로운 데이터셋 RoleMemo를 통해 기존 방식의 한계를 증명하고, SFT와 RL로 학습된 4B 모델의 우수성을 입증했습니다.

핵심 포인트

페르소나를 고려하지 않는 기존 요약 방식의 한계 지적
사실적 인지와 페르소나 조건부 통찰을 분리한 DualMem 제안
4가지 추론 작업을 포함한 RoleMemo 데이터셋 공개
DeepSeek-V3.2 기반 제로샷 방식보다 높은 페르소나 충실도 달성

역할 수행 에이전트(Role-playing agents)는 단기적인 상호작용에는 뛰어나지만, 장기적인 대화는 컨텍스트 윈도우(Context windows)를 초과하여 외부 메모리 프레임워크의 필요성을 불러일으킵니다. 현재의 시스템들은 일반적으로 페르소나를 고려하지 않는 요약(Persona-agnostic summarization)에 의존하며, 이는 페르소나 특유의 해석 없이 사실만을 기록하여 페르소나 충실도(Persona fidelity)를 저해하는 일반적인 응답을 생성합니다. 이러한 격차를 해소하기 위해, 우리는 사실적 파편들을 페르소나를 통해 해석해야만 정답에 도달할 수 있는 4가지 추론 작업을 특징으로 하는 데이터셋인 RoleMemo를 소개합니다. RoleMemo를 통한 평가 결과, 페르소나를 고려하지 않는 프레임워크의 결정적인 한계가 드러났습니다. 이에 따라 우리는 메모리를 두 가지 스트림인 사실적 인지(Factual cognition)와 페르소나 조건부 통찰(Persona-conditioned insight)로 분리하는 DualMem을 제안합니다. 지도 미세 조정(Supervised Fine-Tuning, SFT)과 강화학습(Reinforcement Learning, RL)을 통해 학습된 우리의 4B 파라미터 모델 프레임워크는 지속적인 페르소나 충실도 측면에서 DeepSeek-V3.2 기반의 제로샷(Zero-shot) 페르소나 무관 프레임워크보다 뛰어난 성능을 보입니다. 우리의 리소스는 https://github.com/role2026/rolememo 에서 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

사실에서 통찰로: 역할 수행 에이전트를 위한 페르소나 기반 이중 메모리 프레임워크 및 데이터셋

요약

핵심 포인트

댓글