본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 23. 12:51

다국어 모델은 실제로 개선되고 있는가? 진정한 교차 언어 전이(Cross-Lingual Transfer)의 격리

요약

다국어 모델의 교차 언어 전이 능력을 정확히 측정하기 위한 새로운 지표인 HAT(Hardness Adjusted Transfer) 점수를 제안합니다. 20개의 모델과 주요 벤치마크 분석을 통해 모델 크기 및 시간에 따른 전이 성능의 변화를 규명합니다.

핵심 포인트

  • 기존 측정 방식의 한계를 극복하는 HAT 점수 제안
  • 소규모 모델에서도 교차 언어 전이 능력은 유지됨
  • 모델 크기 증가에 따른 전이 성능 발전 속도는 예상보다 느림
  • 시간 경과에 따른 다국어 전이 성능의 점진적 진전 확인

교차 언어 전이(Cross-lingual transfer)는 모델이 잘 표현된 소스 언어(source languages)의 능력을 충분히 표현되지 않은 타겟 언어(target languages)로 일반화하는 능력입니다. 기존의 모델 전이 강도 측정 방식은 전이의 개선을 소스 언어의 일반적인 정확도 개선과 혼동합니다. 우리는 전이 강도를 신뢰성 있게 포착하는 대안적 지표인 HAT(Hardness Adjusted Transfer) 점수를 제안하며, 이를 사용하여 전이 강도에 영향을 미치는 요인들에 대한 여러 통찰을 도출합니다. 20개의 다양한 언어 모델과 3개의 대중적인 주류 다국어 벤치마크(multilingual benchmarks)를 통한 분석 결과, 우리는 다음과 같이 주장합니다: 1) 소규모 모델에서의 전이는 망가지지 않았으며, 2) 모델 크기에 따른 교차 언어 전이의 발전 속도는 예상보다 느리며, 3) 시간이 지남에 따라 명확한 진전이 있었다는 점입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0