arXiv논문2026. 06. 02. 13:04

마르코프 전이 커널 (Markov Transition Kernels) 학습을 위한 Doeblin 기반 대조 차트

요약

마르코프 전이 커널 학습을 위해 Doeblin 기반 대조 차트 프레임워크를 제안하는 논문입니다. 재시작 법칙을 활용해 역전 가능한 좌표를 생성하며, 앵커링된 대조 리스크를 통해 전이 밀도를 식별하고 밀도 오차를 보정하는 방법을 증명합니다.

핵심 포인트

Doeblin 기반 대조 차트를 통한 전이 커널 학습 프레임워크 제안
재시작 법칙과 앵커 강도를 이용한 역전 가능한 좌표 생성
커널 유효성 복원을 위한 측정 가능한 마르코프화 연산자 도입
비모수적 학습 속도 및 유한 시계 오차 전달에 대한 수학적 증명

마르코프 전이 모델 (Markov transition model)을 학습하는 것은 단순히 조건부 밀도 추정 (conditional density estimation)에 그치지 않습니다. 학습된 객체는 다운스트림 역학 (downstream dynamics)에서 반복 사용되기 전에 반드시 유효한 전이 커널 (transition kernel)이어야 합니다. 본 논문은 대조 목적 함수 (contrastive objectives)로부터 전이 커널을 학습하기 위한 통계적-역학적 좌표 프레임워크인 Doeblin 기반 대조 차트 (Doeblin-anchored contrastive chart)를 소개합니다. 재시작 법칙 (restart law)과 앵커 강도 (anchor strength)가 주어지면, 이 차트는 대상 전이 (target transition)를 재시작 법칙과 혼합합니다. 결과적으로 생성된 앵커링된 커널 (anchored kernel)은 Doeblin-minorized 마르코프 커널 (Markov kernel)인 동시에, 이진 대조 실험 (binary contrastive experiment)에서의 양의 조건부 법칙 (positive conditional law)이며, 원래 전이 법칙 (transition law)에 대한 명시적으로 역전 가능한 좌표 (explicitly invertible coordinate)가 됩니다. 우리는 앵커링된 대조 리스크 (anchored contrastive risk)가 앵커링된 전이 밀도 (anchored transition density)를 식별하고, 초과 리스크 (excess risk)를 밀도 오차 (density error)로 보정함을 증명합니다. 학습된 스코어 (score)의 역전이 부호가 있거나 정규화되지 않은 객체를 생성할 수 있으므로, 우리는 상수 계수 범위 내에서 적분된 $L^1$ 정확도를 유지하면서 커널의 유효성을 복원하는 측정 가능한 마르코프화 연산자 (measurable Markovization operator)를 도입합니다. 오라클 부등식 (Oracle inequalities)과 Hölder--ReLU 근사 경계 (Hölder--ReLU approximation bounds)는 독립적인 전이 쌍 (independent transition pairs)에 대한 비모수적 속도 (nonparametric rates)를 제공합니다. 정체된 기하학적 $\beta$-mixing 궤적 (stationary geometrically $\beta$-mixing trajectories)의 경우, 보수적인 thinning-and-coupling 확장을 통해 유효 표본 크기 (effective sample size)를 갖는 동일한 재구성 인터페이스를 얻을 수 있습니다. 점유 가중 섭동 경계 (Occupancy-weighted perturbation bounds)는 명시적인 커버리지 (coverage) 하에서 1단계 커널 오차 (one-step kernel error)를 유한 시계(finite-horizon) 주변부, 경로 법칙 (path-law), 그리고 점유 측도 (occupation-measure) 오차로 전달합니다.

AI 자동 생성 콘텐츠

원문 바로가기

마르코프 전이 커널 (Markov Transition Kernels) 학습을 위한 Doeblin 기반 대조 차트

요약

핵심 포인트

댓글