arXiv논문2026. 05. 27. 12:19

ENPMR-Bench: 정서적 지원 에이전트를 위한 선제적 메모리 검색 벤치마킹

요약

정서적 지원 에이전트의 핵심 역량인 선제적 메모리 검색을 평가하기 위한 새로운 벤치마크 ENPMR-Bench를 제안합니다. Maslow의 욕구 단계 이론을 기반으로 설계되었으며, 기존 검색 방식의 한계와 개선 방향을 제시합니다.

핵심 포인트

정서적 요구 인지 선제적 메모리 검색(ENPMR) 개념 도입
Maslow의 욕구 이론 기반 1,800개 이상의 대화 데이터셋 구축
기존 임베딩 및 LLM 기반 검색 방식의 성능 한계 확인
CoT 프롬프팅을 통한 정서적 요구와 메모리 간 정렬 개선 시도

메모리 증강 언어 에이전트(Memory-augmented language agents)는 사용자의 잠재적인 정서적 요구를 이해하고 이에 대응하는 것이 매우 중요한 정서적 지원(emotional support)과 같은 감성 애플리케이션(affective applications)에 점점 더 많이 배치되고 있습니다. 그러나 기존 연구는 종종 메모리를 사실적 검색(factual retrieval)을 위한 도구로만 취급하며, 사용자의 정서적 경험을 형성하는 메모리의 역할을 간과하고 있습니다. 본 연구에서는 정서적 요구 인지 선제적 메모리 검색(Emotional Need-aware Proactive Memory Retrieval, ENPMR)을 평가하기 위한 벤치마크인 ENPMR-Bench를 소개합니다. ENPMR은 에이전트가 사용자의 잠재적인 정서적 요구를 추론하고, 공감적 상호작용을 지원하기 위해 적절한 메모리를 선제적으로 검색할 수 있게 하는 핵심 역량입니다. Maslow의 욕구 단계 이론(Maslow's hierarchy of needs)에 기반한 ENPMR-Bench는 1,800개 이상의 메모리 증강 대화(memory-augmented dialogues)를 포함하며, 정서적 요구와 지원적 메모리 유형 간의 구조화된 매핑을 정의합니다. 실험 결과, 임베딩 기반(embedding-based) 방식과 LLM 주도(LLM-driven) 방식을 모두 포함한 현재의 검색 패러다임은 상당한 결함을 보였으며, 공감 점수(empathy scores)가 골든 메모리(golden memory) 조건에 비해 현저히 뒤처지는 것으로 나타났습니다. 사고의 사슬(Chain-of-thought, CoT) 프롬프팅이 추론된 정서적 요구와 검색된 메모리 사이의 정렬(alignment)을 어느 정도 개선하기는 하지만, 여전히 주목할 만한 성능 격차가 존재합니다. 이러한 결과들을 종합하면 현재 에이전트들의 결정적인 한계를 드러내며, 요구 사항에 민감한 메모리 검색을 통해 개인화된 정서적 지원을 발전시키기 위한 방향을 제시합니다.

AI 자동 생성 콘텐츠

원문 바로가기

ENPMR-Bench: 정서적 지원 에이전트를 위한 선제적 메모리 검색 벤치마킹

요약

핵심 포인트

댓글