arXiv논문2026. 06. 15. 11:21

텍스트 기반 및 오디오 기반 언어 모델에서의 동사+Up 구동사의 총체적 저장 (Holistic Storage)

요약

텍스트 및 오디오 기반 언어 모델이 '동사+Up' 구동사를 어떻게 저장하는지 분석한 연구입니다. 모델이 구동사를 개별 단어의 조합이 아닌 하나의 총체적 표현으로 저장한다는 증거를 제시하며 언어 사용 기반 이론을 뒷받침합니다.

핵심 포인트

텍스트 LLM과 ASR 모델의 내부 표현 조사
구동사의 빈도와 예측 가능성에 따른 총체적 저장 확인
언어의 사용 기반 이론(usage-based theories) 지지

언어적 능력의 핵심적인 측면은 저장된 표현(stored representations)과 추상적 지식(abstract knowledge) 사이의 절충(trade-off) 능력입니다. 즉, 학습된 표현을 인출하는 동시에 생산적인 규칙(productive rules)을 적용하여 새로운 표현을 생성할 수 있어야 합니다. 최근 연구들이 언어 모델의 추상적 지식을 조사해 왔으나, 다어구 단위(multi-word units)의 총체적 저장(holistic storage)은 훨씬 적은 관심을 받았습니다. 본 연구에서는 텍스트 기반 LLM(Large Language Models)과 ASR(Automatic Speech Recognition) 모델의 내부 표현을 조사하여, 'V+up' 구동사(phrasal verbs)가 빈도(frequency)와 예측 가능성(predictability)의 함수로서 별도의 표현을 발달시키는지 테스트합니다. 모든 모델은 빈도와 예측 가능성에 의해 유도되는 총체적 저장의 증거를 보여주며, 이는 언어의 사용 기반 이론(usage-based theories)을 더욱 뒷받침합니다.

AI 자동 생성 콘텐츠

원문 바로가기

텍스트 기반 및 오디오 기반 언어 모델에서의 동사+Up 구동사의 총체적 저장 (Holistic Storage)

요약

핵심 포인트

댓글