LLM-뇌 정렬의 교차 언어적 강건성과 그 계산적 근원

대규모 언어 모델 (LLMs)은 언어 이해 과정 중의 신경 활동 (neural activity)을 신뢰성 있게 예측하며, 트랜스포머 (transformer)의 깊이는 계층적 피질 조직 (hierarchical cortical organization)을 반영하는 것으로 해석되어 왔습니다. 그러나 이러한 정렬 (alignment)이 피질하 영역 (subcortical regions)까지 확장되는지, 언어 간에 공간적으로 중첩되는지, 그리고 이러한 정렬의 계산적 근원 (computational roots)이 무엇인지는 여전히 불분명합니다. 본 연구에서는 다국어 전뇌 인코딩 프레임워크 (multilingual, whole-brain encoding framework)를 사용하여, 자연스러운 이야기 청취 과정 중 유형학적으로 구별되는 세 가지 언어인 중국어, 영어, 프랑스어에 걸친 뇌-LLM 정렬을 조사했습니다. 연구 결과, 언어에 관계없이 트랜스포머 기반 모델들은 대뇌 변연계 (limbic), 복측 주의 (ventral attention), 디폴트 모드 네트워크 (default mode network)와 같은 광범위하게 분포된 피질 기능 네트워크 및 피질하 구조를 아우르는 분산된 지형에서의 활동을 예측했습니다. 공간적 정렬 패턴은 상당한 교차 언어적 중첩을 보여주었으며, 모델 레이어 (model layers) 전반에 걸쳐 대체로 안정적으로 유지되었고, 기능적 피질 계층 (functional cortical hierarchies)과 일치하는 제한적인 레이어 진행 (layer progression)을 보였습니다. 이전의 증거와는 대조적으로, 문맥 임베딩 (contextual embeddings)은 정적 임베딩 (static embeddings)보다 우수한 성능을 보이지 않았습니다. 후보 계산 설명들을 테스트하기 위해, 우리는 레이어별 뇌 점수 (layer-wise brain scores)가 서프라이절 (surprisal) 및 내재적 차원 (intrinsic dimensionality), 즉 예측 처리 (predictive processing)와 정보 압축 (information compression)을 반영하는지 조사했습니다. 이 두 가지 계산 지표 중 어느 것도 신경 정렬 프로파일 (neural alignment profiles)을 반영하지 않았습니다. 우리의 연구 결과는 뇌-LLM 정렬이 공간적으로 강건하고 교차 언어적으로 안정적이지만, 예측 불확실성 (predictive uncertainty)이나 표현 기하학 (representational geometry)으로는 설명될 수 없음을 시사합니다. 신경 예측성 (neural predictivity)은 공유된 계층적 계산을 직접적으로 반영하기보다는, 언어 전반에 걸쳐 일반화되는 분산된 어휘-의미론적 대응 (distributed lexical-semantic correspondences)에서 주로 기인할 수 있습니다.

Insights

LLM-뇌 정렬의 교차 언어적 강건성과 그 계산적 근원

요약

핵심 포인트

댓글

선형화의 핵심: 분석 기반 트랜스포머 선형화

Co-LMLM: 연속 질의 기반 제한 메모리 언어 모델

SkillCenter: 자율 AI 에이전트를 위한 대규모 출처 기반 스킬 라이브러리

OpenAI, GPT‑Live 공개

선형화의 핵심: 분석 기반 트랜스포머 선형화

Co-LMLM: 연속 질의 기반 제한 메모리 언어 모델

SkillCenter: 자율 AI 에이전트를 위한 대규모 출처 기반 스킬 라이브러리

OpenAI, GPT‑Live 공개