당신의 감정을 이해합니다: 대화 시스템의 다국어 감정 검증을 통한 심층적인 정서적 지원 강화
요약
본 연구는 대화 시스템의 정서적 지원 강화를 위해 감정적 검증(Emotional validation)에 초점을 맞췄습니다. 이를 위해 120k 규모의 영어-일본어 다국어 코퍼스 M-EDESConv와 음성 테스트 세트 M-TESC를 공개했습니다. 또한, 다국어 감정 인식 게이트 유닛 MEGUMI 및 EmoValidBench 벤치마크를 제안하며 LLM의 정서 이해 개선 필요성을 제시합니다.
핵심 포인트
- 대화 시스템에서 '감정적 검증'은 중요한 치료적 가치를 지닙니다.
- 120k 규모의 다국어 코퍼스 M-EDESConv와 음성 테스트 세트 M-TESC를 공개했습니다.
- MEGUMI는 크로스 모달 어텐션 기반의 다국어 감정 인식 게이트 유닛입니다.
- LLM은 검증 응답 생성에 능하지만, 정서 이해는 여전히 개선이 필요합니다.
감정적 검증(Emotional validation) — 사용자의 감정이 타당함을 명시적으로 인정하는 것 — 은 치료적 가치가 입증되었지만, 계산적 관심은 적었습니다. 대화 시스템에서의 감정적 검증은 (i) 검증 응답 식별, (ii) 검증 타이밍 탐지, 그리고 (iii) 검증 응답 생성으로 분해될 수 있습니다. 이 세 가지 하위 작업 모두에 대한 연구를 지원하기 위해, 우리는 하이브리드 수동 및 자동 주석을 통해 제작된 120k 규모의 영어-일본어 다국어 코퍼스인 M-EDESConv와 다국어 음성 대화 테스트 세트인 M-TESC를 공개합니다. 타이밍 탐지를 위해, 우리는 고정된 XLM-RoBERTa 의미론에 크로스 모달 어텐션 및 게이티드 퓨전을 통해 언어별 감정 인코더를 융합하는 다국어 감정 인식 게이트 유닛(Multilingual Emotion-aware Gated Unit for Mutual Integration), 즉 MEGUMI를 제안합니다. MEGUMI는 M-EDESConv와 M-TESC 데이터셋 모두에서 객관적 및 주관적으로 우수한 성능을 보였습니다. 마지막으로, 우리가 구축한 EmoValidBench 벤치마크를 GPT-4.1 Nano와 Llama-3.1 8B에 적용한 결과, 현재의 LLM(대규모 언어 모델)들이 문맥적으로 유사하고 다양한 검증 응답을 생성하지만, 감정 이해는 여전히 주요 개선 영역으로 남아 있음을 보여줍니다. 프로젝트 페이지: https://github.com/zihaurpang/Multilingual-Emotional-Validation
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기