번역 불가능한 것의 번역: 번역 불가능성에 대한 실행 가능한 온톨로지
요약
언어 간 의미 보존이 어려운 '번역 불가능성'을 다루는 새로운 온톨로지와 보상 전략 분류 체계를 제안합니다. 이를 위해 전략 기반 번역이 적용된 다국어 데이터셋을 구축하여 기계 번역의 한계를 분석하고 개선할 수 있는 토대를 마련했습니다.
핵심 포인트
- 번역 불가능성에 대한 구조화된 온톨로지 및 보상 전략 체계 제안
- 전략 기반 번역을 위한 다국어 데이터셋 구축 및 구현
- 설명적 맥락을 포함하는 주석 보상 전략이 높은 인간 선호도를 보임
- 전략 기반 기계 번역(Strategy-informed MT) 연구를 위한 프레임워크 제공
의미가 언어 간에 직접적으로 보존될 수 없는 사례인 번역 불가능성 (Untranslatability)은 언어학에서는 활발히 연구되어 왔으나, 자연어 처리 (NLP) 분야에서는 충분히 탐구되지 않았습니다. 기계 번역 (MT) 시스템이 표준 벤치마크에서 성능을 향상함에 따라, 번역이 일대일 등가성 (one-to-one equivalence)으로 환원될 수 없는 이러한 사례에서의 한계가 점점 더 집중적으로 나타나고 있습니다. 우리는 번역 불가능성에 대한 구조화된 온톨로지 (ontology)와 함께, 이러한 번역 불가능한 상황에서 의미를 전달하기 위한 특정 기술인 보상 전략 (compensation strategies)의 분류 체계를 소개합니다. 우리는 이 프레임워크를 전략 기반 번역과 쌍을 이루는 번역 불가능한 문장들의 다국어 데이터셋으로 실행 가능하게 구현하여, 번역 동작에 대한 통제된 분석을 가능하게 합니다. 초기 인간 선호도 연구에 따르면, 번역 품질은 사용된 전략에 따라 달라지며, 주석 보상 전략 (Annotation compensation strategy)으로 알려진 설명적 맥락을 포함하는 출력물에 대해 일관된 선호도를 보입니다. 우리의 프레임워크와 데이터셋은 전략 기반 기계 번역 (strategy-informed machine translation)을 연구하고 모델링하기 위한 토대를 제공합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기