본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 03. 12:13

관용구의 분해 가능성 가설 재고: 분포 학습(Distributional Learning)을 통한 증거

요약

본 연구는 언어 모델을 통해 관용구의 분해 가능성과 통사적 유연성 사이의 관계를 분석합니다. 실험 결과, 관용구의 안정화는 단순 빈도보다 분해 가능성이 더 강력한 영향을 미친다는 것을 입증했습니다.

핵심 포인트

  • 관용구의 분해 가능성과 통사적 유연성 간의 음의 상관관계 확인
  • 언어 모델 내부의 분해 가능성 측정 지표 제안
  • 관용구 학습은 빈도보다 분해 가능성에 더 크게 의존함
  • 놀람도, 분해 가능성, 빈도가 관용구 안정화에 복합적으로 기여

관용구(Idioms)는 구성 요소의 의미가 비유적인 전체에 기여하는 정도인 분해 가능성(decomposability)의 관점에서 분석될 수 있습니다. 분해 가능성은 통사적 유연성(syntactic flexibility)을 예측하는 것으로 생각됩니다. 반면, 사용 기반 설명(Usage-based accounts)은 관용구의 동작을 화자의 친숙도 및 예측 가능성과 같은 분포적 경험(distributional experience)의 결과로 돌립니다. 본 연구에서는 통제된 분포 학습자(distributional learners)로서 문맥화된 언어 모델(contextualised language models)을 사용하여 이러한 관점들을 조사합니다. 우리는 모델 내부의 분해 가능성 측정 지표를 제안하고, 이를 사전 학습(pretraining) 과정 중의 관용구 학습을 추적하면서 인간의 평가, 통사적 유연성 및 예측 가능성과 연관 지어 분석합니다. 모델에서 도출된 분해 가능성은 인간의 판단과 약한 상관관계를 보이며, 통사적 유연성과는 작지만 일관된 음의 상관관계를 나타냅니다. 사전 학습 분석 결과, 모델 내 관용구 표현의 안정화는 빈도(frequency)만으로는 설명되지 않음을 보여줍니다. 대신, 놀람도(surprisal), 분해 가능성(decomposability), 그리고 빈도가 모두 기여하며, 그중 분해 가능성이 학습 의존적(training-dependent)인 가장 강력한 효과를 보입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0