arXiv논문2026. 05. 01. 12:57

의미론을 넘어: 소규모 언어 모델을 기반으로 한 기계 번역에서의 세밀한 감정 보존 측정

요약

본 논문은 소규모 언어 모델(SLMs)을 활용하여 기계 번역(MT) 과정에서 미묘한 감정 뉘앙스를 보존하는 방법을 탐구한다. 연구진은 EuroLLM, Aya Expanse, Gemma와 같은 최신 SLM들을 사용하여 GoEmotions 데이터셋 기반의 다섯 개 유럽 언어에 걸쳐 감정 보존 성능을 평가했다. 또한, 감정 인식 프롬프팅 기법과 MT 평가를 위한 ModernBERT의 효용성도 함께 분석하여 감정적 충실도를 높이는 방안을 제시한다.

핵심 포인트

기계 번역에서 의미적 동등성보다 감정적 충실도가 중요한 도전 과제임을 강조함.
EuroLLM, Aya Expanse, Gemma와 같은 소규모 언어 모델(SLMs)의 성능을 활용하여 감정 보존 능력을 평가함.
GoEmotions 데이터셋과 다섯 개 유럽 언어를 사용하여 광범위한 감정 보존 테스트를 수행함.
감정 인식 프롬프팅 기법이 MT 과정에서 감정 보존을 개선하는 효과적인 방법임을 조사함.

감정의 미묘한 뉘앙스를 보존하는 것은 여전히 기계 번역 (MT) 의 도전 과제이며, 여기서 의미적 동등성이 감정적 충실도보다 우선시되는 경우가 많습니다. 본 논문은 EuroLLM, Aya Expanse, Gemma 라는 세 가지 최첨단 소규모 언어 모델 (SLMs) 이 백번역 (backtranslation) 과정에서 세밀한 감정을 유지하는 성능을 평가합니다. 28 개의 서로 다른 범주를 가진 Reddit 댓글로 구성된 GoEmotions 데이터셋을 사용하여 독일어, 프랑스어, 스페인어, 이탈리아어, 폴란드어라는 다섯 가지 유럽 언어에 걸친 감정 보존을 평가합니다. 구체적으로 우리는 (i) 이러한 SLM 들이 감정적 감정을 유지하는 고유한 능력, (ii) 감정 인식 프롬팅 (emotion-aware prompting) 이 보존을 개선하는 효과성, 그리고 (iii) MT 평가에서의 감정 분류를 위한 BERT 의 현대적인 대안인 ModernBERT 의 성능에 대해 조사합니다.

AI 자동 생성 콘텐츠

원문 바로가기