arXiv논문2026. 05. 05. 13:02

대화 감정 인식 (ERC) 을 위한 불확실한 지문 인코더 사전 학습 언어 모델: 인간 평가 및 유효성 연구

요약

본 논문은 대화 감정 인식(ERC) 모델이 단순히 높은 정확도를 넘어 인간의 직관과 일치하는 해석 가능성을 갖추도록 하는 새로운 접근법을 제안합니다. 기존의 사전 학습 언어 모델(PLM)은 성능은 뛰어나지만, 왜 특정 예측을 했는지에 대한 설명력이 부족하며, 특히 데이터 불균형 문제로 인해 소수 감정을 중립으로 오분류하는 경향이 있습니다. 이를 해결하기 위해 PLM과 '불확실한 지문(Fuzzy Fingerprints, FFP)'를 결합하여, 각 감정의 특징적인 프로토타입을 정의하고 입력 발화가 이 프로토타입들과 얼마나 불확실하게 유사한지를 측정함으로써 해석 가능성과 성능을 동시에 향상시킵니다.

핵심 포인트

PLM 기반 ERC 모델은 높은 성능에도 불구하고 예측 과정에 대한 설명력이 부족하다는 한계가 있다.
데이터 불균형 문제로 인해 소수 감정이 중립 클래스로 과분류되는 경향이 심각하다.
제안된 방법은 PLM의 잠재 공간과 '불확실한 지문(FFP)'을 결합하여 해석 가능한 접근법을 제시한다.
FFP는 각 감정별 프로토타입을 정의하고, 입력 발화가 이 프로토타입들과 얼마나 불확실하게 유사한지를 측정하는 방식으로 작동한다.
이 방법은 중립 클래스로의 과분류를 줄이고, 심층 신경망 추론과 인간의 직관 사이의 간극을 연결하여 최상위 성능을 달성했다.

대화 감정 인식 (Emotion Recognition in Conversations, ERC) 에서 모델의 결정은 세련된 인간의 감각과 일치해야 하며, 이상적으로는 분류 과정에 대한 통찰력을 제공해야 합니다. 표준 인코더 사전 학습 언어 모델 (PLM: Pre-trained Language Models) 은 이러한 작업에서 최상위 수준 (state-of-the-art) 을 이루고 있지만, 특정 예측이 어떻게 이루어지는지에 대한 통찰력은 거의 없습니다. 이는 특히 불균형 데이터셋에서 문제가 되며, 대부분의 발화 (utterances) 가 중립 (neutral) 로 라벨링되어 있어 이러한 모델들이 소수 감정 (minority emotions) 을 다수 중립 클래스로 빈번하게 오분류합니다. 이 문제를 해결하기 위해, 우리는 PLM 과 불확실한 지문 (Fuzzy Fingerprints, FFPs) 을 결합하여 ERC 에 대한 새로운, 해석 가능한 접근법을 소개했습니다. FFP 는 PLM 의 잠재 공간 (latent space) 에서의 특징적인 클래스 활성화 패턴을 반영하는 클래스 특이적 프로토타입 (prototypes) 을 제공합니다. 이는 각 감정을 위해 훈련 인스턴스별 풀링된 대화 문맥 의존성 임베딩 (pooled conversational context-dependent embeddings) 의 활성화를 순위화하고 불확실하게 (fuzzifying) 유도합니다. 추론 시간 (inference time) 에는 각 입력 발화가 유사하게 불확실한 지문으로 처리되고, 각 FFP 를 정의하는 불확실 집합의 교집합의 합집합에 기반한 불확실 유사성 함수를 사용하여 감정 프로토타입과 매칭됩니다. 실험 결과는 FFP 통합이 중립 클래스로의 과분류 (overclassification) 를 줄였음을 보여줍니다. 인간 평가는 또한 FFP 예측의 적절성을 추가로 지원합니다. 따라서 제안된 방법은 심층 신경망 추론과 인간의 감각 사이의 간극을 연결하며, 동시에 분류 절차에 대한 가치 있는 통찰력을 제공하여 최상위 수준의 성능을 달성합니다.

AI 자동 생성 콘텐츠

원문 바로가기

대화 감정 인식 (ERC) 을 위한 불확실한 지문 인코더 사전 학습 언어 모델: 인간 평가 및 유효성 연구

요약

핵심 포인트

댓글