arXiv논문2026. 05. 29. 11:29

확산 모델(Diffusion Models)은 저차원 다중 모드 분포(Multi-Modal Distributions) 학습에 통계적으로 최적이다

요약

본 연구는 점수 기반 확산 모델이 저차원 다중 모드 분포를 학습할 때의 통계적 효율성을 이론적으로 분석합니다. 기존의 강력한 정규성 가정 없이도 확산 모델이 본질적 차원에 의존하는 근사 최적의 수렴 속도를 가짐을 증명했습니다.

핵심 포인트

저차원 다중 모드 분포 학습에 대한 통계적 샘플 복잡도 규명
차원의 저주를 극복하는 본질적 차원 기반의 수렴 속도 증명
매끄러움이나 로그-오목성 가정 없이도 광범위한 분포에 적용 가능
1-Wasserstein 거리 기준 근사 최적의 샘플 복잡도 도출

점수 기반 확산 모델(Score-based diffusion models)은 고차원 분포, 특히 저차원 및 다중 모드(multi-modal) 구조를 보이는 분포를 학습하는 데 있어 놀라운 경험적 성공을 입증해 왔습니다. 그러나 이들의 통계적 효율성에 대한 이론적 이해는 여전히 제한적입니다. 기존 이론들은 일반적으로 균일하게 유계된 밀도(uniformly bounded densities)나 전역적으로 매끄러운 점수 함수(globally smooth score functions)와 같은 강력한 정규성 가정(regularity assumptions)에 의존하며, 이는 이러한 본질적인 구조를 포착하는 데 실패합니다. 본 연구에서는 저차원 부분 공간(subspaces)의 합집합에 지지 집합(support)을 갖는 분포를 학습하기 위한 확산 모델의 샘플 복잡도(sample complexity)를 연구합니다. 각 부분 공간 내의 데이터 분포가 서브 가우시안(subgaussian)이라고 가정할 때, 우리는 확산 모델이 1-Wasserstein 거리에서 $\varepsilon$ 오차를 달성하기 위해 최대 $\widetilde{O}(\varepsilon^{-k \vee 2})$개의 샘플이 필요함을 보여줍니다. 여기서 $k$는 본질적 차원(intrinsic dimension)입니다. 이 근사 최적(near-optimal) 수렴 속도는 오직 본질적 차원에만 의존하며, 차원의 저주(curse of dimensionality)를 겪는 이전의 이론적 보장들을 크게 개선합니다. 특히, 우리의 분석은 매끄러움(smoothness), 유계 밀도(bounded-density), 또는 로그-오목성(log-concavity) 가정을 부과하지 않고도 광범위한 분포 집합에 적용됩니다. 종합적으로, 우리의 결과는 확산 모델이 다중 모드 데이터를 자연스럽게 수용하면서도 본질적인 저차원 구조에 통계적으로 적응할 수 있음을 보여주며, 복잡한 고차원 학습 작업에서의 성공에 대한 엄밀한 이론적 근거를 제공합니다.

AI 자동 생성 콘텐츠

원문 바로가기

확산 모델(Diffusion Models)은 저차원 다중 모드 분포(Multi-Modal Distributions) 학습에 통계적으로 최적이다

요약

핵심 포인트

댓글