MetaHOPE: 은유 번역 오류 분석을 위한 은유 지향적 평가 프레임워크
요약
은유 번역의 오류 심각도를 인지하고 평가하기 위한 새로운 프레임워크인 MetaHOPE를 제안합니다. 최신 NMT 및 LLM 모델을 대상으로 은유 번역 성능을 분석하고, 연구를 위한 병렬 코퍼스 리소스를 함께 제공합니다.
핵심 포인트
- 은유 번역 오류 평가를 위한 MetaHOPE 프레임워크 제안
- GoogleMT, GPT5.4, Hunyuan-7b 등 최신 모델 성능 조사
- 인간 사후 편집을 통한 새로운 병렬 코퍼스 리소스 생성
- 은유의 의미론적 복잡성 및 문화적 맥락 해결을 위한 연구
본 의견서(opinion paper)에서 우리는 은유(metaphor) 번역을 평가하기 위해 오류 심각도를 인지하는 주석 프레임워크인 MetaHOPE를 제안합니다. 은유는 의미론적 복잡성(semantic complexity), 문맥 의존성(contextual dependency), 그리고 문화적 임베딩(cultural embeddings)의 특성을 나타내며, 이는 자연어 처리(NLP) 모델에 모호성 문제를 야기할 수 있기 때문에 기계 번역(MT) 및 자연어 이해 및 처리(NLU, NLP)에 어려움을 줍니다. 최신(state-of-the-art) NLP 모델들이 은유 번역에서 어떤 성능을 보이는지 조사하기 위해, 우리는 신경망 기계 번역(NMT) 모델 및 대규모 언어 모델(LLM)로서 GoogleMT, GPT5.4, Hunyuan-7b라는 세 가지 대표적인 시스템을 선정했습니다. 우리는 영어-중국어 및 중국어-영어 번역 목적으로 VUAMC와 PSUCMC를 포함한 두 가지 인간 주석 은유 코퍼스(metaphor corpora)를 사용했습니다. 우리가 사용한 원본 코퍼스는 단일 언어(monolingual)였으며, 우리는 MetaHOPE 프레임워크를 사용하여 오류 주석(error annotation)을 수행하였고, 또한 이중 언어 사용을 위한 새로운 리소스로서 인간 사후 편집(human post-edited) 골드 레퍼런스(gold reference)를 생성했습니다. 우리는 은유 번역 주석을 위한 MetaHOPE 평가 프레임워크, 병렬 코퍼스(parallel corpora) 리소스, 그리고 최신(SOTA) 자동 번역 모델에 대한 오류 분석이 은유 번역 연구 분야에 유용하며 통찰을 제공할 수 있다고 믿습니다. 우리는 논문 채택 시 우리의 리소스를 공개적으로 공유할 예정입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기