본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 15. 11:21

텍스트 기반 및 오디오 기반 언어 모델에서의 동사+Up 구동사의 총체적 저장 (Holistic Storage)

요약

텍스트 및 오디오 기반 언어 모델이 '동사+Up' 구동사를 어떻게 저장하는지 분석한 연구입니다. 모델이 구동사를 개별 단어의 조합이 아닌 하나의 총체적 표현으로 저장한다는 증거를 제시하며 언어 사용 기반 이론을 뒷받침합니다.

핵심 포인트

  • 텍스트 LLM과 ASR 모델의 내부 표현 조사
  • 구동사의 빈도와 예측 가능성에 따른 총체적 저장 확인
  • 언어의 사용 기반 이론(usage-based theories) 지지

언어적 능력의 핵심적인 측면은 저장된 표현(stored representations)과 추상적 지식(abstract knowledge) 사이의 절충(trade-off) 능력입니다. 즉, 학습된 표현을 인출하는 동시에 생산적인 규칙(productive rules)을 적용하여 새로운 표현을 생성할 수 있어야 합니다. 최근 연구들이 언어 모델의 추상적 지식을 조사해 왔으나, 다어구 단위(multi-word units)의 총체적 저장(holistic storage)은 훨씬 적은 관심을 받았습니다. 본 연구에서는 텍스트 기반 LLM(Large Language Models)과 ASR(Automatic Speech Recognition) 모델의 내부 표현을 조사하여, 'V+up' 구동사(phrasal verbs)가 빈도(frequency)와 예측 가능성(predictability)의 함수로서 별도의 표현을 발달시키는지 테스트합니다. 모든 모델은 빈도와 예측 가능성에 의해 유도되는 총체적 저장의 증거를 보여주며, 이는 언어의 사용 기반 이론(usage-based theories)을 더욱 뒷받침합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0