언어 모델의 구획화 문제 (Language models struggle with compartmentalization)
요약
본 연구는 대규모 언어 모델(LLMs)이 학습 데이터 내에서 동일한 잠재 개념의 다양한 표현들 사이에서 통계적 강점을 식별하고 공유하는 데 어려움을 겪는 '구획화(compartmentalization)' 현상을 분석합니다. LLM은 각 개념의 표현에 대해 병렬적인 내부 표현을 학습하여 모델 용량이 중복성으로 포화되고 샘플 효율성이 감소할 수 있습니다. 또한, 합성 병렬 데이터만으로는 이 문제를 해결하기 어려우며, 개입 효과가 표현의 수에 따라 달라지는 상전이 현상을 보인다는 점도 밝힙니다.
핵심 포인트
- LLMs는 동일 개념의 다양한 표현을 공유하는 데 실패하는 '구획화' 현상을 보일 수 있다.
- 개념별로 병렬적인 내부 표현을 학습하면 모델 용량 낭비와 샘플 효율성 감소를 초래한다.
- 합성 병렬 데이터만으로는 구획화 문제를 개선하기 어렵다.
- 모델의 개입 효과는 표현의 수에 따라 달라지는 상전이(phase transition) 현상을 보인다.
대규모 언어 모델 (LLMs)이 사용하는 학습 데이터 내에서, 동일한 잠재 개념 (latent concept)은 종종 여러 가지 서로 다른 방식으로 제시됩니다. 예를 들어, 동일한 사실이 영어와 스와힐리어로 나타나거나, 많은 함수가 Python과 Haskell 모두로 표현될 수 있으며, 명제를 형식 언어 (formal language)와 자연어 (natural language) 모두로 표현할 수 있습니다. 본 연구에서는 LLM이 통일된 개념의 서로 다른 표현들 사이에서 통계적 강점 (statistical strength)을 식별하고 공유하는 데 실패하는 구획화 (compartmentalization) 현상을 보일 수 있음을 보여줍니다. 최악의 경우, LLM은 개념의 각 표현에 대해 단순히 병렬적인 내부 표현 (internal representations)을 학습하며, 이로 인해 모델 용량 (model capacity)이 중복성으로 포화되고, 이러한 표현의 수가 늘어남에 따라 샘플 효율성 (sample efficiency)이 감소합니다. 또한 우리는 합성 병렬 데이터 (synthetic parallel data)가 그 자체로는 쉽게 학습됨에도 불구하고, 이러한 문제를 개선하는 데 실패할 수 있음을 입증합니다. 이 프레임워크 하에서, 우리는 소형 모델의 경우 초기 다국어 학습 (multilingual learning)이 거의 전적으로 구획화되어 있다는 것을 발견했습니다. 마지막으로, 우리가 연구한 모든 개입 (interventions)은 그 효과가 서로 다른 표현의 수에 따라 달라지는 상전이 (phase transition) 현상을 보이며, 이는 언어 모델링 목적 함수 (language modeling objective)가 표현을 통합하는 데 있어 일관되지 않을 수 있음을 시사합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기