커리큘럼 학습 하에서 언어 모델링이 쉬운 언어의 종류는 무엇인가?
요약
본 연구는 언어 모델(LM)이 특정 유형론적 경향성을 학습하는 방식과 관련하여, 커리큘럼 학습(Curriculum Learning, CL)의 효과를 탐구합니다. 특히 무작위 입력 순서 대신 쉬운 문장부터 시작하는 CL 방식을 적용했을 때, LM의 명목상 귀납적 편향에 상당한 영향을 미친다는 것을 발견했습니다.
핵심 포인트
- 언어 모델은 언어 유형론적 경향성(예: 어순)을 학습할 수 있으며, 이는 예측 가능한 조건이 존재합니다.
- 본 연구는 LM의 귀납적 편향과 학습 시나리오가 어떻게 상호작용하는지 탐구합니다.
- 커리큘럼 학습(CL)은 무작위 입력 대신 쉬운 문장부터 시작하는 방식으로, LM의 성능에 영향을 미칩니다.
- CL을 기존 LM 기반 탐색에 적용한 결과, CL이 LM의 명목상 귀납적 편향에 유의미한 변화를 가져옴을 입증했습니다.
수천 가지 확인된 언어 중 많은 수가 공통적인 특징 구성을 공유하여, 유형론적으로 매우 드문 (예: 목적어-동사-주어 어순) 또는 불가능한 언어에서 매우 흔한 특징 조합 (예: 주어-목적어-동사 어순) 으로 이어지는 스펙트럼을 형성합니다. 핵심 질문 중 하나는 이러한 유형론적 경향이 예측될 수 있는 조건이 무엇이며, 구체적으로 언어 모델 (LM) 의 학습 편향 (learning bias) 이 그러한 패턴을 재현하기에 충분한지 여부입니다. 본 연구에서는 이러한 분석에 한 차원을 더하여, 즉 LMs 의 학습 시나리오를 추가함으로써, 이것이 LMs 의 귀납적 편향 (inductive bias) 과 어떻게 상호작용하는지 탐구합니다. 구체적으로 첫 번째 연구로서, 발달론적 동기에서 비롯된 학습 시나리오인 커리큘럼 학습 (Curriculum Learning, CL) 의 효과를 살펴봅니다. 즉, 무작위 순서의 입력 대신 더 간단한 문장부터 시작하는 방식입니다. 우리는 기존 LM 기반 탐색 (El-Naggar et al., 2025a,b) 에 간단한 CL 변형을 추가하여 확장했으며, 그 결과 CL 이 LMs 의 명목상 귀납적 편향에 상당한 영향을 미친다는 것을 발견했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기