기계 번역 품질은 어디까지 도달할 수 있는가? 목표 지향적 설정에서의 외재적 담화 평가
요약
기존의 내재적 기계 번역 평가 방식의 한계를 지적하며, 하류 작업의 성공 여부를 측정하는 외재적 담화 평가 프레임워크를 제안합니다. 정적 체제의 엔티티 카운팅과 상호작용적 체제의 다중 에이전트 게임을 통해 번역 품질이 실제 의사소통에 미치는 영향을 분석합니다.
핵심 포인트
- 높은 내재적 MT 품질이 반드시 성공적인 하류 담화로 이어지지는 않음
- 정적 체제에서 지칭 일관성을 측정하기 위한 엔티티 카운팅 작업 제안
- 상호작용적 체제에서 다중 에이전트 게임을 통한 번역 실패 영향 분석
- 목표 지향적 환경이 외재적 MT 평가를 위한 유효한 프레임워크임을 입증
기존의 기계 번역 (MT) 지표와 담화 중심 평가들은 번역 오류가 초래하는 하류(downstream) 결과들을 측정하지 않고, 주로 번역 품질을 내재적 (intrinsically)으로 평가합니다. 본 연구에서는 정적 (static) 및 상호작용적 (interactive)이라는 두 가지 뚜렷한 체제 하에서 기계 번역의 외재적 (extrinsic) 담화 평가에 초점을 맞춥니다. 정적 체제 하에서는 담화 내 지칭 일관성 (referential consistency)을 조사하기 위한 탐침 (probe)으로서 엔티티 카운팅 (entity counting) 작업을 제안합니다. 우리는 높은 내재적 MT 품질이 하류 담화의 성공을 안정적으로 예측하지 못하며, 강력한 MT 시스템들도 여전히 지칭 불일치를 생성한다는 것을 보여줍니다. 상호작용적 체제 하에서는 장기적 의사소통과 조율을 조사하기 위한 탐침으로서 목표 지향적 다중 에이전트 Welfare Diplomacy 게임을 연구합니다. 우리는 상호작용 특유의 번역 실패가 하류 조율에 영향을 미친다는 것을 발견했습니다. 우리의 결과는 목표 지향적 환경이 담화에 민감한 외재적 MT 평가를 위한 실행 가능한 프레임워크임을 강조합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기