AI 지원 문화유산 보급: 암각화 문서에서 NMT와 용어집 증강 LLM 번역의 비교
요약
본 연구는 암각화 학술 텍스트와 같이 전문 용어가 밀집된 문화유산 자료를 다국어로 보급하는 과정에서 발생하는 번역 품질 문제를 다룹니다. 스페인어 암각화 텍스트에 대한 세 가지 영어 기계 번역(MT) 설정(DeepL, Gemini-Simple, Gemini-RAG)을 비교한 결과, 용어집 증강 프롬프팅을 적용한 Gemini-RAG가 가장 높은 정확도의 전문 용어 일치율과 전반적인 품질을 보여주었습니다. 이는 최소한의 자원으로도 문화유산 번역에서 효과적인 용어 제어를 달성할 수 있음을 시사합니다.
핵심 포인트
- 용어가 밀집된 문화유산 텍스트는 정확하고 일관된 전문 용어 사용이 필수적이다.
- Gemini-RAG(용어집 증강 프롬프팅)는 DeepL과 Gemini-Simple보다 높은 전문 용어 일치율을 기록하며 우수한 성능을 보였다.
- 용어집 증강 프롬프팅은 복잡한 모델 수정 없이도 문화유산 번역의 용어 제어를 개선할 수 있는 저비용 방법이다.
- 평가 과정에서 다방향 직접 평가(DA)와 표적 용어 감사(terminology auditing)를 활용하여 성능을 측정했다.
문화유산 기관들은 연구 및 해석 자료를 전 세계적으로 점점 더 많이 보급하고 있지만, 다국어 보급은 제한된 예산과 인력으로 인해 제약을 받고 있습니다. 암각화(rock art)와 같이 용어가 밀집된 영역에서는 번역 품질이 정확하고 일관된 전문 용어에 달려 있으며, 작은 어휘적 오류가 비전문가를 오도하고 재사용을 감소시킬 수 있습니다. 본 연구에서는 복잡한 모델 측면의 수정보다는 단순하고 운영 가능한 개입에 초점을 맞추어, 스페인어 암각화 학술 텍스트에 대한 세 가지 영어 기계 번역(MT) 설정을 비교합니다: (1) 강력한 NMT 베이스라인으로서의 DeepL, (2) Gemini-Simple (기본 프롬프트를 사용한 LLM), (3) Gemini-RAG (용어 쌍 검색을 통해 용어집 증강 프롬프팅을 적용한 동일한 LLM). PEARMUT을 사용하여, 우리는 (i) 다방향 직접 평가(Direct Assessment, 0--100) 및 (ii) 제한된 MQM 분류 체계를 사용한 표적 용어 감사(terminology auditing)를 통해 인간 평가를 수행합니다. Gemini-RAG는 전체적인 품질을 유지하면서(평균 DA: Gemini-RAG 85.3 vs. Gemini-Simple 85.2), DeepL(80.3)을 능가하는 가장 높은 정확한 용어 일치(exact-match terminology) 정확도(81.4%)를 기록한 반면, Gemini-Simple은 69.1%, DeepL은 64.4%를 기록했습니다. 이러한 결과는 기관이 최소한의 용어 자원과 경량화된 평가 절차를 유지한다면, 용어집 증강 프롬프팅(glossary-augmented prompting)이 문화유산 번역에서 용어 제어를 개선할 수 있는 낮은 비용의 방법임을 보여줍니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기