왜 동일한 관찰로부터 결론이 갈라지는가: 추론을 통한 세계 모델 비식별성 (World-Model Non-Identifiability)의 공식화
요약
본 논문은 동일한 관찰(데이터)을 공유함에도 불구하고 사람들이 서로 다른 결론에 도달하는 현상을 상대방의 인지적 결함이 아닌, 추론 및 학습 과정 자체에 내재된 '비식별성(Non-identifiability)' 문제로 설명합니다. 이 비식별성은 추론 설정($ heta$)의 차이에서 오는 $ heta$-수준과, 반복적인 데이터 노출 및 업데이트 규칙으로 인해 세계 모델($W$) 자체가 분리되는 $W$-수준 두 가지 방식으로 체계화됩니다. 연구진은 이를 분석하기 위해 Reference, Exploration, Stabilization, Horizon 등으로 구성된 추론 프로필 $ heta$를 도입하고, AI 규제 논쟁 등 실제 사례에 적용하여 그 의미를 확장합니다.
핵심 포인트
- 의견 불일치는 상대방의 결함이 아닌, 인지적/학습적 비식별성 문제로 설명될 수 있다.
- 비식별성은 추론 설정($ heta$) 차이에 따른 $ heta$-수준과 세계 모델($W$) 자체의 분리라는 $W$-수준으로 체계화된다.
- 추론 프로필 $ heta$는 Reference, Exploration, Stabilization, Horizon 등의 요소로 구성되어 출력이 어떻게 분리되는지 보여준다.
- 이 프레임워크는 계산적, 관찰적, 조정 제약 조건 하에서 의견 불일치가 특정 기준(예: 추상성 vs 구체성)으로 투영되는 경향을 설명한다.
- 심층 표현 학습 및 AI 규제 논쟁 등 실제 사례에 이 비식별성 프레임워크를 적용할 수 있다.
사람들이 동일한 문서와 관찰을 공유하면서도 서로 다른 결론에 도달할 때, 이러한 의견 불일치는 종종 상대방이 인지적으로 결함이 있거나, 비이성적이거나, 혹은 악의적으로 행동한다는 판단으로 이어지곤 합니다. 본 논문은 이러한 차이가 상대방의 결함이라기보다, 추론 (Inference) 및 학습 (Learning)에 내재된 비식별성 (Non-identifiability)의 한 형태로 설명하는 것이 더 적절하다고 주장합니다. 우리는 이 현상을 두 가지 수준으로 체계화합니다: (i) $\theta$-수준 비식별성: 추론 설정 (Inference settings)이 다르기 때문에 동일한 세계 모델 $W$ 하에서도 결론이 갈라지는 경우; (ii) $W$-수준 비식별성: 특정 추론 설정 $\theta$를 반복적으로 사용함으로써 데이터 노출과 업데이트 규칙에 편향이 생겨, 학습된 세계 모델 $W$ 자체가 갈라지는 경우. 우리는 Reference (참조), Exploration (탐색), Stabilization (안정화), Horizon (지평)으로 구성된 추론 프로필 $\theta = (R, E, S, D)$를 도입하며, 동일한 관찰 $o$와 동일한 $W$에 대해서도 출력이 어떻게 분리될 수 있는지 보여줍니다. 나아가, 학습 시스템에 대한 일반적인 제약 조건인 계산적 (Computational), 관찰적 (Observational), 그리고 조정 (Coordination) 제약의 결과로서, 왜 의견 불일치가 소수의 기준들—추상적 대 구체적, 외재화 가능성 (Externalizability), 그리고 질서 대 자유—로 투영되는 경향이 있는지 설명합니다. 마지막으로, 표현 계층 (Representation hierarchy), 잠재 상태 추정 (Latent-state estimation), 그리고 정규화-탐색 트레이드오프 (Regularization-exploration trade-offs)를 포함한 심층 표현 학습 (Deep representation learning)과 이 프레임워크를 연관시키고, AI 규제 논쟁에 대한 사례 연구를 통해 이 프레임워크를 예시합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기