arXiv논문2026. 06. 17. 12:28

영어가 최선의 교사가 아닐 때: 교차 언어 인컨텍스트 학습(Cross-Lingual In-Context Learning)에서의 소스 언어 효과

요약

교차 언어 인컨텍스트 학습(ICL)에서 소스 언어 선택이 성능에 미치는 영향을 분석한 연구입니다. 기존 미세 조정 방식과 달리 ICL에서는 기존의 통찰이 그대로 적용되지 않음을 밝히고, 언어 혼동 현상 분석과 새로운 소스 언어 선택 휴리스틱을 제안합니다.

핵심 포인트

교차 언어 ICL에서 기존 미세 조정의 통찰이 일관되게 적용되지 않음
7개 태스크와 6개 모델을 통한 광범위한 실증적 연구 수행
생성 태스크의 주요 장애물인 언어 혼동(Language confusion) 분석
효과적인 소스 언어 선택을 위한 새로운 휴리스틱 제시

다국어 NLP(Natural Language Processing)에서의 교차 언어 전이(Cross-lingual transfer)는 지도 미세 조정(Supervised fine-tuning) 맥락에서 널리 탐구되어 왔으며, 이 과정에서는 데이터 가용성과 언어적 유사성 같은 요소들이 전이 품질을 크게 결정합니다. 분야가 퓨샷 인컨텍스트 학습(Few-shot In-Context Learning, ICL)으로 전환됨에 따라, 미세 조정(Fine-tuning)에서 얻은 통찰이 변함없이 그대로 적용될 것이라고 흔히 가정됩니다. 그러나 이러한 가정은 엄격하게 평가된 적이 없으며, 교차 언어 ICL을 위한 소스 언어를 어떻게 선택해야 하는지에 대한 의문을 남겨두고 있습니다. 우리는 7개의 태스크, 6개의 모델, 그리고 유형론적으로 다양한 언어 세트에 걸쳐 ICL에서의 교차 언어 전이에 대한 광범위한 실증적 연구를 수행합니다. 나아가 우리는 교차 언어 ICL의 생성 태스크(Generative tasks)에서 주요 장애물인 언어 혼동(Language confusion)을 분석합니다. 우리의 연구 결과는 기존의 미세 조정(Fine-tuning) 기반의 기대치가 ICL 체제에서는 일관되게 적용되지 않음을 보여주며, 소스 언어를 효과적으로 선택하기 위한 대안적인 휴리스틱(Heuristics)을 제시합니다.

AI 자동 생성 콘텐츠

원문 바로가기

영어가 최선의 교사가 아닐 때: 교차 언어 인컨텍스트 학습(Cross-Lingual In-Context Learning)에서의 소스 언어 효과

요약

핵심 포인트

댓글