arXiv논문2026. 05. 07. 17:50

예측-원인적 격차: 불가능성 정리와 대규모 신경증거

요약

본 연구는 예측 표현 학습(predictive representation learning)에서 발생하는 '예측-원인적 격차(predictive-causal gap)'라는 구조적 한계를 보고합니다. 신경망이 시스템의 실제 동역학을 모델링하기보다 환경 자체를 추적하는 경향이 있으며, 이 격차는 차원이 증가할수록 심화됩니다. 연구진은 이러한 현상이 최적화 오류가 아닌 예측 목표의 본질적인 속성임을 증명했으며, 운영적 근접성을 통해 부분적으로 완화할 수 있지만 명시적인 시스템-환경 경계 설정 없이는 원인적 충실도를 회복하기 어렵다고 결론지었습니다.

핵심 포인트

예측 표현 학습은 종종 실제 시스템 동역학보다 환경 자체를 추적하는 경향이 있다.
차원이 증가함에 따라 예측 모델의 '원인적 실명(causally blind)' 현상이 심화된다.
이 격차는 최적화 아티팩트가 아닌, 예측 목표 구조의 본질적인 한계이다.
운영적 근접성(operational grounding)은 성능을 개선하지만, 명시적인 시스템-환경 경계 설정 없이는 원인적 충실도를 완전히 회복할 수 없다.

우리는 예측 표현 학습 (predictive representation learning) 에서 체계적인 실패 모드를 보고합니다. 선형-가우시안 동역학 (linear-Gaussian dynamics) 을 예측하기 위해 훈련된 2695 개의 신경망 구성 중, 최적의 인코더는 모델링하려는 시스템이 아닌 환경 자체를 추적합니다. 평균 원인적 충실도 (mean causal fidelity -- 인코더 민감도가 할당받는 시스템 자유도의 비율) 는 0.49 이며, 0.70 을 초과하는 구성은 2.5% 만입니다. 실패는 차원이 증가할수록 심화됩니다: N=100 에서 최적의 인코더는 원인적 실명 (causally blind -- 충실도 ~10^{-8}) 이 되지만, 원인적 표현보다 예측 오차가 92% 낮습니다. 우리는 이것이 최적화 아티팩트 (optimization artifact) 가 아니라 예측 목표의 구조적 속성임을 증명합니다: 환경 모드가 시스템 모드보다 느리거나 덜 노이즈가 있을 때, 모든 집합 리스크 최소화자 (minimizer of the population risk) 는 전자를 인코딩합니다. 이러한 예측-원인적 격차 (predictive-causal gap) 를 보이는 동역학의 집합은 매개변수 공간에서 열린 집합 (open set) 이며 양의 측정 (positive measure) 을 가집니다. 비선형 Duffing-GRU 스윙 (nonlinear Duffing-GRU sweep) 에서, 제약이 없는 예측자는 55% 의 작업 (95% 신뢰구간 41--68%) 에서 환경 우세 표현 (environment-dominant representations) 을 학습하고, 운영적 근접성 (operational grounding -- 손실을 시스템 관측량에 제한하는 것) 하에서는 24% 입니다 (p=2.3e-3); 환경 이동 (environment shift) 하에서 중위 분포 외 MSE 인플레이션 (out-of-distribution MSE inflation) 은 1.82 배 versus 1.00 배입니다. 운영적 근접성은 격차를 부분적으로 억제하지만, 명시적인 시스템-환경 경계 (system-environment boundary) 가 없으면 원인적 충실도는 결코 회복되지 않습니다. 결과는 예측-원인적 격차를 학습의 구조적 한계로 식별하며, 자기지도 표현 학습, 월드 모델, 그리고 스케일링 패러다임에 대한 함의를 갖습니다.

AI 자동 생성 콘텐츠

원문 바로가기

예측-원인적 격차: 불가능성 정리와 대규모 신경증거

요약

핵심 포인트

댓글