arXiv논문2026. 05. 26. 12:50

인간 및 기계 번역에서의 탈직역 가설(Deliteralization Hypothesis) 검증

요약

LLM이 기계 번역에서 탈직역 가설을 어떻게 적용하는지 검증한 연구입니다. WMT24++ 데이터셋을 통해 LLM이 반복적 수정을 거칠수록 번역이 덜 직역된다는 점과 인간의 번역 방식에 근접하고 있음을 확인했습니다.

핵심 포인트

LLM은 반복적 자기 수정을 통해 탈직역을 수행함
최신 LLM은 인간 번역과의 직역 격차를 좁히고 있음
LLM은 인간 사후 교정자와 유사한 수정 목표를 지향함
탈직역 가설이 LLM 생성 과정에 적용됨을 입증

최근 전용 신경망 기계 번역(NMT) 시스템에서 범용 대규모 언어 모델(LLM)로의 전환은 기계 번역의 지형을 재편하였으며, LLM은 이전 모델들보다 더 유창하고 덜 직역된(less literal) 결과물을 생성한다고 보고되고 있습니다. 본 연구에서는 이러한 변화가 탈직역 가설(deliteralization hypothesis)—번역이 초안 작성 및 수정 과정을 거치면서 점진적으로 덜 직역되게 된다는 번역학의 오랜 주장—에도 적용되는지 테스트합니다. WMT24++ 데이터셋을 사용하여, 54개의 언어 쌍과 세 가지 작업(직접 번역, 반복적 자기 수정, 인간 초안의 사후 교정)에 대해 인간의 번역 및 사후 교정(post-editions) 결과물을 두 개의 NMT 시스템 및 여섯 개의 LLM과 비교합니다. 직역 정도(literality)는 6가지 휴리스틱(heuristics)을 기반으로 구축된 검증된 합성 직역 지수(Synthetic Literality Index)를 통해 측정됩니다. 연구 결과, (i) 인간의 번역은 테스트된 모든 기계 번역(MT) 시스템보다 여전히 유의미하게 덜 직역되어 있었으나, 최근의 LLM이 그 격차를 좁히고 있음을 확인했습니다; (ii) 자신의 출력물을 반복적으로 수정하도록 프롬프트(prompt)를 제공했을 때, LLM은 단조 증가적으로 탈직역(deliteralize)을 수행하였으며, 이는 해당 가설이 LLM 생성 과정에 본질적으로 적용된다는 첫 번째 증거를 제공합니다; (iii) 사후 교정자(post-editors)로서 LLM은 인간 사후 교정자의 수정 트리거(revision triggers)를 역전시켜, 직역된 초안은 허용하는 반면 수정의 목표로는 관용적인 인간의 표현 방식을 지향한다는 것을 발견했습니다.

AI 자동 생성 콘텐츠

원문 바로가기

인간 및 기계 번역에서의 탈직역 가설(Deliteralization Hypothesis) 검증

요약

핵심 포인트

댓글