인간 및 기계 번역에서의 탈직역 가설(Deliteralization Hypothesis) 검증
요약
LLM이 기계 번역에서 탈직역 가설을 어떻게 적용하는지 검증한 연구입니다. WMT24++ 데이터셋을 통해 LLM이 반복적 수정을 거칠수록 번역이 덜 직역된다는 점과 인간의 번역 방식에 근접하고 있음을 확인했습니다.
핵심 포인트
- LLM은 반복적 자기 수정을 통해 탈직역을 수행함
- 최신 LLM은 인간 번역과의 직역 격차를 좁히고 있음
- LLM은 인간 사후 교정자와 유사한 수정 목표를 지향함
- 탈직역 가설이 LLM 생성 과정에 적용됨을 입증
최근 전용 신경망 기계 번역(NMT) 시스템에서 범용 대규모 언어 모델(LLM)로의 전환은 기계 번역의 지형을 재편하였으며, LLM은 이전 모델들보다 더 유창하고 덜 직역된(less literal) 결과물을 생성한다고 보고되고 있습니다. 본 연구에서는 이러한 변화가 탈직역 가설(deliteralization hypothesis)—번역이 초안 작성 및 수정 과정을 거치면서 점진적으로 덜 직역되게 된다는 번역학의 오랜 주장—에도 적용되는지 테스트합니다. WMT24++ 데이터셋을 사용하여, 54개의 언어 쌍과 세 가지 작업(직접 번역, 반복적 자기 수정, 인간 초안의 사후 교정)에 대해 인간의 번역 및 사후 교정(post-editions) 결과물을 두 개의 NMT 시스템 및 여섯 개의 LLM과 비교합니다. 직역 정도(literality)는 6가지 휴리스틱(heuristics)을 기반으로 구축된 검증된 합성 직역 지수(Synthetic Literality Index)를 통해 측정됩니다. 연구 결과, (i) 인간의 번역은 테스트된 모든 기계 번역(MT) 시스템보다 여전히 유의미하게 덜 직역되어 있었으나, 최근의 LLM이 그 격차를 좁히고 있음을 확인했습니다; (ii) 자신의 출력물을 반복적으로 수정하도록 프롬프트(prompt)를 제공했을 때, LLM은 단조 증가적으로 탈직역(deliteralize)을 수행하였으며, 이는 해당 가설이 LLM 생성 과정에 본질적으로 적용된다는 첫 번째 증거를 제공합니다; (iii) 사후 교정자(post-editors)로서 LLM은 인간 사후 교정자의 수정 트리거(revision triggers)를 역전시켜, 직역된 초안은 허용하는 반면 수정의 목표로는 관용적인 인간의 표현 방식을 지향한다는 것을 발견했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기