WorldKernel: 세계 모델은 허용 가능한 가능한 세계들의 결합 커널이다
요약
본 논문은 예측기가 반사실적 세계 간의 결합(counterfactual couplings)을 표현하지 못하는 구조적 한계를 지적합니다. 이를 해결하기 위해 세계 모델을 허용 가능한 세계들의 결합 커널로 정의하고, 양의 준정부호성을 활용해 반사실적 경계를 제한하는 이론적 프레임워크를 제안합니다.
핵심 포인트
- 예측기가 반사실적 결합의 불확실성을 표현하지 못하는 실패 모드 보고
- 세계 모델을 준정부호 결합 커널(PSD coupling kernel)로 정의
- 존재론적 공리를 통해 반사실적 경계를 최대 1/3까지 축소
- 학습된 제약 조건을 통해 반사실적 격차를 빠르게 해소 가능
충분히 강력한 예측기(predictor)에게 충분한 관찰(observational) 및 개입(interventional) 데이터가 주어진다면 충분하다는 일반적인 가정이 존재합니다. 우리는 이 가정에 반하는 실패 모드(failure mode)를 보고합니다. 수백 개의 구조적 인과 모델(structural causal models)에 걸쳐, 식별된 양(identified quantities)에 대해서는 강력한 예측기와 베이지안 베이스라인(Bayesian baseline) 모두 성공하지만, 식별되지 않은 양(unidentified quantities, 즉 반사실적 세계들 사이의 결합(couplings between counterfactual worlds))에 대해서는 예측기가 하나의 점으로 붕괴하며, 모델의 28%에서는 그 어떤 유효한 모델도 생성할 수 없는 결과로 나타납니다. 반면 실제 값은 허용 가능한 구간(admissible interval)이며, 데이터가 아무리 많아져도 좁혀지지 않습니다. 이 격차는 구조적입니다. 즉, 예측은 반사실적 결합(counterfactual couplings)에 대한 불확실성을 표현할 수 없습니다. 우리는 세계 모델을 허용 가능한 세계들에 대한 단일 양의 준정부호 결합 커널(positive semidefinite coupling kernel) $K(T, T')$로 정의합니다. 이 커널의 대각 성분(diagonal)은 일반적인 사후 확률(posterior, 예측기가 복원하는 것)이며, 비대각 성분(off-diagonal)은 예측기가 복원할 수 없지만 모든 반사실(counterfactual)이 읽어내는 세계 간 결합(cross-world coupling)입니다. 본 논문은 그 비대각 성분에 대한 이론입니다. 이는 실재합니다. 동일한 사후 확률을 가진 두 상태는 세계 간 질의(cross-world query)에서 차이를 보이며, 비대각 성분은 반사실을 확정하는 결합입니다. 이는 경계(bound)를 설정할 수 있습니다. 양의 준정부호성(positive semidefiniteness)은 주변 확률 분포(marginals)가 결여하고 있는 부분 식별 정보(partial-identifying information)이며, 이를 강제함으로써 정확한 응답 유형 프로그램(response-type program)을 다루기 어려운 경우에도 다항 시간 내에 반사실의 경계를 제한할 수 있습니다. 논리적 구조(Logical structure)는 이를 더욱 정교하게 만듭니다. 존재론적 공리(ontology axioms)는 직접적으로 닿지 않는 결합에까지 전파되어 경계를 최대 3분의 1까지 좁힙니다. 또한 이는 습득될 수 있습니다. 표적화된 흉터(targeted scars), 즉 마주친 불가능성(infeasibilities)으로부터 학습된 제약 조건들은 표적화되지 않은 방식보다 몇 배 더 빠르게 격차를 줄입니다. 이것의 완전한 재구성은 허용 가능한 세계들의 근사적 계수(approximate counting)이며, Sly-Sun 임계값(threshold) 미만에서는 다룰 수 있고 그 이상에서는 근사가 불가능합니다. 우리는 최악의 경우(worst case)를 극복한다고 주장하지는 않습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기