본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 14. 07:07

무엇이 단어를 배우기 어렵게 만드는가? 영어 어휘 난이도에 대한 L1(모국어)의 영향 모델링

요약

본 연구는 단어 학습의 어려움을 결정하는 요인과 그 난이도가 학습자의 모국어(L1)에 따라 어떻게 달라지는지 모델링했습니다. 그래디언트 부스팅 모델을 사용하여 스페인어, 독일어, 중국어 사용 영어 학습자를 위한 어휘 난이도를 계산적으로 추정합니다. 분석 결과, 단어 친숙도는 모든 언어에서 중요한 요소였으나, 스페인어와 독일어 사용자에게는 철자 전이가 추가적인 영향을 미쳤고, 중국어 사용자에게는 친숙도와 표면 특징의 조합으로만 난이도가 결정됨을 밝혀냈습니다.

핵심 포인트

  • 단어 학습 난이도는 단어의 친숙도, 의미, 표면 형태 등 여러 특징에 의해 복합적으로 결정된다.
  • L1(모국어)은 어휘 난이도 예측에 중요한 변수로 작용하며, 언어별로 다른 전이 메커니즘을 보인다.
  • 스페인어 및 독일어 학습자는 철자 전이가 난이도 예측에 추가적으로 기여한다.
  • 중국어 학습자의 경우, 난이도는 친숙도와 표면 특징의 조합으로만 형성된다.

무엇이 단어를 배우기 어렵게 만들며, 그 난이도는 학습자의 모국어에 따라 어떻게 달라질까요? 우리는 단어의 친숙도(예: 빈도), 의미, 표면 형태(surface form), 그리고 교차 언어 전이(cross-linguistic transfer)와 관련된 특징(features)들로 학습된 그래디언트 부스팅 모델(gradient-boosted models)을 사용하여, 모국어가 스페인어, 독일어 또는 중국어인 영어 학습자들을 위한 어휘 난이도를 계산적으로 모델링합니다. Shapley value를 사용하여 각 특징 그룹의 중요도를 결정합니다. 단어 친숙도는 세 언어 모두에서 공유되는 지배적인 특징 그룹입니다. 그러나 스페인어 및 독일어 사용 학습자에 대한 예측은 철자 전이(orthographic transfer)에 추가적으로 의존합니다. 이러한 전이 메커니즘은 중국어 학습자에게는 불가능하며, 이들의 난이도는 친숙도와 표면 특징(surface features)의 조합에 의해서만 형성됩니다. 우리의 모델은 어휘 커리큘럼을 설계하는 데 사용할 수 있는, 해석 가능하고 L1(모국어)에 맞춤화된 난이도 추정치를 제공합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0