본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 06. 17. 12:33

강건한 확산 정책 (Diffusion Policies)을 위한 Kolmogorov 회귀

요약

확산 정책(Diffusion Policies)의 시간적 드리프트 문제를 해결하기 위해 역방향 Kolmogorov 방정식을 도입한 새로운 연구입니다. Cameron-Martin 공간으로의 격상을 통해 확률적 스코어 매칭을 결정론적 PDE 문제로 변환하여 궤적의 정규성을 개선합니다.

핵심 포인트

  • Kolmogorov 방정식을 통한 확산 정책의 시간적 드리프트 현상 해결
  • Cameron-Martin 손실 함수를 사용하여 모델의 수렴성 및 궤적 정규성 향상
  • Kolmogorov 잔차를 활용하여 보상 신호 없이도 결정론적 실패 탐지 가능
  • PushT 벤치마크 및 제조 공정 제어에서 기존 모델 대비 성능 대폭 개선

유한 차원 (FD) 확산 정책 (diffusion policies)은 (물리적 시스템에 배포될 때) 장기 성능을 저하시키는 이산화 아티팩트 (discretization artifacts)로 인해 시간적 드리프트 (temporal drift)를 나타냅니다. 우리는 확산 정책을 힐베르트 공간 (Hilbert space)의 부분 집합인 Cameron-Martin 공간으로 격상시키는 역방향 Kolmogorov 방정식 (backward Kolmogorov equation)을 도입합니다. 본질적으로, 이는 확률적 스코어 매칭 (stochastic score matching)을 결정론적 경계값 PDE 문제로 대체하는 것입니다. 우리의 핵심 혁신은 가우시안 측도 이론 (Gaussian measure theory)에 기반하며, 여기서 확산 노이즈 공분산 연산자 (diffusion noise covariance operator)는 추론 시 모델의 샘플에 대한 정규성 (regularity) 개념을 규정하는 컬러 노이즈 분포 (colored noise distribution)로부터 실현됩니다. 우리는 유도된 정밀도 가중 Cameron-Martin 손실 (precision-weighted Cameron-Martin loss)을 사용하여 확산 모델을 학습시키며, 추론 중 PDE 진단 도구로서 Kolmogorov 잔차 (Kolmogorov residual)를 도입합니다. 이러한 대체는 (i) 경계 상수의 값이 액션 차원 (action dimension)이 아닌 커널의 유효 랭크 (effective rank)에 의존하는 수렴 보장, (ii) 스펙트럼 가중치 (spectral weighting)를 통한 궤적 정규성 (trajectory regularity) 개선, (iii) 보상 신호 없는 결정론적 실패 탐지기를 제공합니다. 두 가지 응용 영역에 걸친 검증은 상당한 개선을 보여줍니다: PushT 조작 벤치마크에서, Cameron-Martin 손실은 최대 에피소드 보상에서 17%의 개선(MSE의 0.78 대비 0.95)을 달성하였으며, 도입된 잔차 크기를 통해 추론 중 단계 간 드리프트 (inter-step drifts)를 67.6% 감소시켰습니다. 마찬가지로, 일정 재공품 (CONWIP) 흐름 제어가 적용된 6개 스테이션 제조 라인에서, 우리는 클래식 LSTM 베이스라인보다 28.4% 낮은 RMSE를 달성하였고, 높은 기아 현상 (starvation-event) 재현율 (테스트 사이클에서 1.0) 및 효과적인 병목 현상 식별 (테스트 세트에서 Precision@1 = 1.0, 13배의 신호 대 잡음비)을 달성했습니다. 마지막으로, 우리는 Hamilton-Jacobi 도달 가능성 이론 (reachability theory)을 통해 배차 정책 (dispatch policies)을 인증하였으며, 이는 100회의 시뮬레이션 실행 동안 제어되지 않은 배차와 비교하여 데드락 (deadlock) 이벤트를 96% 감소시켰습니다 (351개 이벤트 방지).

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0