본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 13. 17:20

아동 지향 언어(CDL)는 단어 학습에 최적화되어 있는가? 구어 동사 의미 습득에 대한 계산 연구

요약

본 연구는 아동 지향 언어(CDL)가 단어 학습, 특히 동사 의미 습득에 최적화되어 있는지 신경 언어 모델을 사용하여 계산적으로 조사했습니다. 그 결과, 구문 구조의 방해가 전반적인 학습을 저해하는 반면, CDL과 구어 ADL로 훈련된 모델이 더 높은 회복력을 보였습니다. 또한, 동사 의미 습득이 견고한 통사적 숙련도보다 먼저 나타나는 '의미 우선(semantic-first)' 궤적이 관찰되었으며, 이는 CDL만의 고유한 특성이라기보다는 광범위한 구어체 언어의 일반적인 속성을 반영할 수 있음을 시사합니다.

핵심 포인트

  • CDL과 ADL로 훈련된 신경 모델을 비교하여 언어 학습 지원 메커니즘을 계산적으로 분석함.
  • 구문 구조적 방해(syntactic disruption)는 모든 데이터셋에서 학습 성능 저하를 유발했음.
  • CDL 및 구어 ADL 모델은 쓰기 입력 기반 모델보다 높은 회복력을 보임.
  • 동사 의미 습득이 통사적 숙련도보다 먼저 나타나는 '의미 우선(semantic-first)' 궤적이 관찰됨.
  • 동사 학습의 이점은 CDL에만 국한된 것이 아니라, 더 넓은 구어체 언어의 일반적인 속성일 수 있음.

아동 지향 언어(Child-Directed Language, CDL)가 언어 학습을 지원하도록 최적화되어 있는지, 그리고 그것이 언어 발달의 어떤 측면을 촉진하는지 알아봅니다. 우리는 CDL과 성인 지향 언어(Adult-Directed Language, ADL)로 훈련된 신경 언어 모델을 사용하여 이 질문을 조사합니다. 모델 훈련 데이터에서 통사적 또는 어휘적 동시 발생 정보(co-occurrence information)를 선택적으로 제거하고, 이러한 조작이 동사 의미 습득에 미치는 영향을 평가합니다. 구문 구조의 방해가 모든 데이터셋에서 학습을 저해하는 반면, CDL과 구어 ADL로 훈련된 모델은 쓰기 입력으로 훈련된 모델보다 훨씬 높은 회복력을 보입니다. 훈련 과정 전반에 걸쳐 의미론적 및 통사적 성능을 추적한 결과, 동사 의미가 견고한 통사적 숙련도보다 먼저 나타나는 '의미 우선(semantic-first)' 궤적을 관찰했으며, 이는 구어 영역에서 특히 CDL에서 가장 두드러지게 나타나는 비동시성입니다. 이러한 결과는 이전에 CDL에 기인한다고 여겨졌던 동사 학습의 이점이 실제로는 고유하게 CDL에 특화된 최적화라기보다는 더 광범위한 구어체(spoken register)의 속성을 반영할 수 있음을 시사합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0