arXiv논문2026. 06. 03. 11:05

“관계자 귀하”를 넘어: 청중과 의도에 맞춘 기계 번역 (Machine Translation) 맞춤화

요약

사용자의 의도와 청중에 맞춘 목적 기반 기계 번역(Purpose-driven MT)의 성능을 체계적으로 평가한 연구입니다. LLM을 활용한 명시적 지시문이 기존의 퓨샷 예시나 문맥보다 번역 적응성을 높이며, 기존 평가지표가 이러한 맞춤화 품질을 제대로 측정하지 못함을 밝혀냈습니다.

핵심 포인트

명시적 지시문이 번역의 적응성을 실질적으로 향상시킴
모델 크기가 크고 비격식 도메인일수록 지시문의 효과가 큼
지시문 방식이 퓨샷 예시나 문맥 제공보다 성능 우위
전통적 MT 평가지표는 맞춤화된 번역 품질을 포착하지 못함
문맥을 통한 지시문 자동 생성으로 적응성 격차 80% 완화

번역 품질은 목적에 따라 달라집니다. 동일한 원문이라도 청중(Audience), 어조(Tone), 그리고 의사소통 의도(Communicative intent)에 따라 서로 다른 번역을 요구합니다. 하지만 기계 번역 (MT) 모델과 평가지표 (Metrics)는 번역을 소스(Source)에서 타겟(Target)으로의 고정된 매핑으로 취급합니다. 대규모 언어 모델 (LLMs)은 사용자가 원문과 함께 목적을 명시적으로 지정할 수 있게 해주지만, 이러한 능력은 대규모로 평가된 적이 없습니다. 우리는 50개 언어, 5가지 모델 크기, 8가지 텍스트 도메인에 걸쳐 목적 기반 기계 번역 (Purpose-driven MT)에 대한 체계적인 평가를 도입합니다. 연구 결과, (1) 명시적인 지시문 (Instructions)은 번역의 적응성 (Adaptedness)을 실질적으로 향상시키며, 모델 크기가 클수록, 자원이 풍부한 언어일수록, 그리고 비격식 도메인 (대화, 소셜 미디어)에서 더 큰 이득을 얻는다는 것을 발견했습니다. (2) 지시문은 의미론적으로 일치하는 퓨샷 (Few-shot) 예시나 문단 수준의 문맥 (Context)보다 성능이 뛰어납니다. (3) 전통적인 기계 번역 (MT) 평가지표는 적응 품질을 포착하지 못하며, 종종 맞춤화된 번역에 대해 감점을 부여합니다. (4) 정교하게 큐레이션된 지시문을 사용할 수 없는 경우, 모델은 주변 문서 문맥으로부터 지시문을 스스로 생성할 수 있으며, 이를 통해 큐레이션된 지시문과의 적응성 격차를 최대 80%까지 줄일 수 있습니다. 우리의 결과는 목적에 맞게 적응된 기계 번역 (Purpose-adapted MT)이 LLMs의 실행 가능하고 측정 가능한 능력임을 입증하는 동시에, 목적을 인식하는 평가지표 (Purpose-aware metrics)의 필요성을 강조합니다.

AI 자동 생성 콘텐츠

원문 바로가기

“관계자 귀하”를 넘어: 청중과 의도에 맞춘 기계 번역 (Machine Translation) 맞춤화

요약

핵심 포인트

댓글