본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 21. 10:57

LLM-뇌 정렬의 교차 언어적 강건성과 그 계산적 근원

요약

본 연구는 다국어 전뇌 인코딩 프레임워크를 사용하여 중국어, 영어, 프랑스어 세 가지 언어에 걸친 뇌와 대규모 언어 모델(LLMs)의 정렬을 조사했습니다. 그 결과, LLM은 특정 언어에 국한되지 않고 대뇌 변연계, 디폴트 모드 네트워크 등 광범위하게 분포된 피질 기능 네트워크 및 피질하 구조 전반에서 활동을 예측하는 것으로 나타났습니다. 이러한 뇌-LLM 정렬 패턴은 상당한 교차 언어적 중첩성을 보이며, 이는 신경 예측성보다는 일반화되는 분산된 어휘-의미론적 대응에 기인할 수 있음을 시사합니다.

핵심 포인트

  • LLMs는 특정 언어에 국한되지 않고 광범위하게 분포된 피질 기능 네트워크 및 피질하 구조 전반에서 활동을 예측한다.
  • 뇌-LLM 정렬 패턴은 상당한 교차 언어적 중첩성을 보이며, 이는 모델 레이어 전반에 걸쳐 안정적으로 유지된다.
  • 정렬의 계산적 근원은 단순한 문맥 임베딩이나 서프라이절 같은 지표로는 설명되지 않는다.
  • 신경 예측성은 공유된 계층적 계산보다는 언어 전반에 걸쳐 일반화되는 분산된 어휘-의미론적 대응에서 주로 기인한다.

대규모 언어 모델 (LLMs)은 언어 이해 과정 중의 신경 활동 (neural activity)을 신뢰성 있게 예측하며, 트랜스포머 (transformer)의 깊이는 계층적 피질 조직 (hierarchical cortical organization)을 반영하는 것으로 해석되어 왔습니다. 그러나 이러한 정렬 (alignment)이 피질하 영역 (subcortical regions)까지 확장되는지, 언어 간에 공간적으로 중첩되는지, 그리고 이러한 정렬의 계산적 근원 (computational roots)이 무엇인지는 여전히 불분명합니다. 본 연구에서는 다국어 전뇌 인코딩 프레임워크 (multilingual, whole-brain encoding framework)를 사용하여, 자연스러운 이야기 청취 과정 중 유형학적으로 구별되는 세 가지 언어인 중국어, 영어, 프랑스어에 걸친 뇌-LLM 정렬을 조사했습니다. 연구 결과, 언어에 관계없이 트랜스포머 기반 모델들은 대뇌 변연계 (limbic), 복측 주의 (ventral attention), 디폴트 모드 네트워크 (default mode network)와 같은 광범위하게 분포된 피질 기능 네트워크 및 피질하 구조를 아우르는 분산된 지형에서의 활동을 예측했습니다. 공간적 정렬 패턴은 상당한 교차 언어적 중첩을 보여주었으며, 모델 레이어 (model layers) 전반에 걸쳐 대체로 안정적으로 유지되었고, 기능적 피질 계층 (functional cortical hierarchies)과 일치하는 제한적인 레이어 진행 (layer progression)을 보였습니다. 이전의 증거와는 대조적으로, 문맥 임베딩 (contextual embeddings)은 정적 임베딩 (static embeddings)보다 우수한 성능을 보이지 않았습니다. 후보 계산 설명들을 테스트하기 위해, 우리는 레이어별 뇌 점수 (layer-wise brain scores)가 서프라이절 (surprisal) 및 내재적 차원 (intrinsic dimensionality), 즉 예측 처리 (predictive processing)와 정보 압축 (information compression)을 반영하는지 조사했습니다. 이 두 가지 계산 지표 중 어느 것도 신경 정렬 프로파일 (neural alignment profiles)을 반영하지 않았습니다. 우리의 연구 결과는 뇌-LLM 정렬이 공간적으로 강건하고 교차 언어적으로 안정적이지만, 예측 불확실성 (predictive uncertainty)이나 표현 기하학 (representational geometry)으로는 설명될 수 없음을 시사합니다. 신경 예측성 (neural predictivity)은 공유된 계층적 계산을 직접적으로 반영하기보다는, 언어 전반에 걸쳐 일반화되는 분산된 어휘-의미론적 대응 (distributed lexical-semantic correspondences)에서 주로 기인할 수 있습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.CL (NLP)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0