AI 지원 문화유산 보급: 암각화 문서에서 NMT와 용어집 증강 LLM 번역의 비교

문화유산 기관들은 연구 및 해석 자료를 전 세계적으로 점점 더 많이 보급하고 있지만, 다국어 보급은 제한된 예산과 인력으로 인해 제약을 받고 있습니다. 암각화(rock art)와 같이 용어가 밀집된 영역에서는 번역 품질이 정확하고 일관된 전문 용어에 달려 있으며, 작은 어휘적 오류가 비전문가를 오도하고 재사용을 감소시킬 수 있습니다. 본 연구에서는 복잡한 모델 측면의 수정보다는 단순하고 운영 가능한 개입에 초점을 맞추어, 스페인어 암각화 학술 텍스트에 대한 세 가지 영어 기계 번역(MT) 설정을 비교합니다: (1) 강력한 NMT 베이스라인으로서의 DeepL, (2) Gemini-Simple (기본 프롬프트를 사용한 LLM), (3) Gemini-RAG (용어 쌍 검색을 통해 용어집 증강 프롬프팅을 적용한 동일한 LLM). PEARMUT을 사용하여, 우리는 (i) 다방향 직접 평가(Direct Assessment, 0--100) 및 (ii) 제한된 MQM 분류 체계를 사용한 표적 용어 감사(terminology auditing)를 통해 인간 평가를 수행합니다. Gemini-RAG는 전체적인 품질을 유지하면서(평균 DA: Gemini-RAG 85.3 vs. Gemini-Simple 85.2), DeepL(80.3)을 능가하는 가장 높은 정확한 용어 일치(exact-match terminology) 정확도(81.4%)를 기록한 반면, Gemini-Simple은 69.1%, DeepL은 64.4%를 기록했습니다. 이러한 결과는 기관이 최소한의 용어 자원과 경량화된 평가 절차를 유지한다면, 용어집 증강 프롬프팅(glossary-augmented prompting)이 문화유산 번역에서 용어 제어를 개선할 수 있는 낮은 비용의 방법임을 보여줍니다.

Insights

AI 지원 문화유산 보급: 암각화 문서에서 NMT와 용어집 증강 LLM 번역의 비교

요약

핵심 포인트

댓글

내 친구가 안드로이드 폰 자체에서 실행되는 멀티 에이전트 Claude Code 오케스트레이터를 만들었습니다

원유 및 채권 수익률 상승에 따라 주가지수 하락

Sihl, 라벨 컨버터를 위한 수성 잉크젯 코팅 PE 필름 출시

아프리카, 글로벌 맥주 생산량 감소 추세 거스르다

내 친구가 안드로이드 폰 자체에서 실행되는 멀티 에이전트 Claude Code 오케스트레이터를 만들었습니다

원유 및 채권 수익률 상승에 따라 주가지수 하락

Sihl, 라벨 컨버터를 위한 수성 잉크젯 코팅 PE 필름 출시

아프리카, 글로벌 맥주 생산량 감소 추세 거스르다