arXiv논문2026. 06. 18. 11:45

멀티모달 감정-원인 쌍 추출을 위한 강건한 쌍 신뢰도 학습

요약

멀티모달 감정-원인 쌍 추출(MECPE)의 신뢰도 문제를 해결하기 위한 RPCL 프레임워크를 제안합니다. 정답 쌍과 어려운 부정 사례 간의 신뢰도 격차를 확보하여 모델의 판별력과 안정성을 높였습니다.

핵심 포인트

기존 MECPE 모델의 쌍 신뢰도 취약성 문제 정의
RPCL 프레임워크를 통한 신뢰도 차이 마진 제약 도입
오염된 뷰를 활용한 깨끗한 쌍 예측 정렬 기법 적용
EFC, MECAD, MEC4 데이터셋에서 성능 향상 입증

멀티모달 감정-원인 쌍 추출 (Multimodal emotion-cause pair extraction, MECPE)은 후보 쌍들에 대해 신뢰할 수 있는 쌍 신뢰도 (pair confidence)를 필요로 합니다. 기존의 쌍 점수 측정기 (pair scorers)는 일반적으로 유효한 후보들에 대해 쌍 수준의 교차 엔트로피 (pair-level cross entropy)를 사용하며, 이는 링크들을 대부분 독립적으로 취급합니다. 이로 인해 경쟁하는 원인들 사이의 상대적 신뢰도 기하학 (confidence geometry)이 충분히 제약되지 않아, 정답 쌍 (gold pairs)이 어려운 부정 사례 (hard negatives)와 가깝게 유지되거나 부수적인 비정답 문맥 (non-gold context)에 의존하게 되는 문제가 발생합니다. 우리는 이러한 취약성을 쌍 신뢰도 취약성 (pair-confidence brittleness)으로 정의하고, 쌍 신뢰도 학습을 위한 학습 전용 프레임워크인 RPCL (Robust Pair Confidence Learning)을 제안합니다. RPCL은 쌍 신뢰도가 판별력 있고 안정적이도록 장려합니다. 즉, 신뢰도 차이 마진 제약 (confidence-difference margin constraint)을 통해 정답 쌍을 행 단위의 어려운 부정 사례 (row-wise hard negatives)로부터 분리하며, 깨끗한 쌍 예측 (clean pair predictions)을 비정답 문맥 발화 표현 (non-gold contextual utterance representations)이 부분적으로 손상된 오염된 뷰 (corrupted view)에서의 예측과 정렬시킵니다. 추론 시에는 기존의 깨끗한 쌍 점수 측정기 (clean pair scorer)와 디코딩 파이프라인을 변경 없이 그대로 사용합니다. ECF, MECAD, MEC4 데이터셋에서 RPCL은 전체 텍스트-오디오-비디오 설정에서 매칭된 베이스 모델 대비 3개 시드 평균 Pair F1을 2.58에서 2.83 퍼센트 포인트 향상시켰으며, 세 데이터셋 모두에서 평균 Pair AUPRC를 개선했습니다. 진단 분석 결과, 더 큰 정답-부정 신뢰도 격차 (gold-negative confidence gaps)와 더 낮은 마진 위반 심각도 (margin-violation severity)를 보여주었습니다. 이러한 결과는 쌍 신뢰도를 명시적으로 형성하는 것이 MECPE를 위한 효과적인 학습 전략임을 시사합니다.

AI 자동 생성 콘텐츠

원문 바로가기

멀티모달 감정-원인 쌍 추출을 위한 강건한 쌍 신뢰도 학습

요약

핵심 포인트

댓글