본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 06. 12:48

Flow Sampling: 정규화되지 않은 밀도에서 샘플링 학습을 위한 분해능 조건부 과정

요약

본 논문은 정규화되지 않은 밀도(unnormalized densities)에서 샘플링하는 문제를 다루며, 특히 에너지 함수로 정의된 목표 분포에 대한 효율적인 샘플러 학습 프레임워크인 Flow Sampling을 제안합니다. 이 방법은 확산 모델과 플로우 매칭을 결합하여 노이즈 샘플에 조건부되는 분해능 확산 드리프트(denoising diffusion drift)를 학습하는 것이 핵심입니다. 또한, 인터폴란트 과정을 활용하여 에너지 함수 평가 횟수를 최소화하고, 리만 다양체로의 확장성을 입증함으로써 다양한 기하학적 공간에서의 샘플링을 가능하게 합니다.

핵심 포인트

  • Flow Sampling 프레임워크를 통해 정규화되지 않은 밀도에서 효율적으로 샘플링하는 방법을 제시합니다.
  • 확산 모델과 플로우 매칭을 결합하여, 에너지 함수 기반의 분해능 확산 드리프트(denoising diffusion drift)를 학습합니다.
  • 인터폴란트 과정을 활용하여 에너지 함수 평가 비용을 최소화하고 샘플링 효율성을 높였습니다.
  • 공식은 리만 다양체에 자연스럽게 확장되어 초구면이나 쌍곡 공간 같은 복잡한 기하학적 공간에서도 적용 가능합니다.

정규화되지 않은 밀도 (unnormalized densities) 에서 샘플링하는 것은 생성 모델링 문제와 유사하지만, 목표 분포는 데이터 샘플이 아닌 알려진 에너지 함수 (energy function) 로 정의됩니다. 에너지 함수를 평가하는 것이 종종 비용이 많이 들기 때문에, 주요 과제는 효율적인 샘플러를 학습하는 것입니다. 우리는 데이터가 없는 (data-free) 설정을 위해 확산 모델 (diffusion models) 과 플로우 매칭 (flow matching) 을 기반으로 한 Flow Sampling 프레임워크를 소개합니다. 우리의 학습 목표는 노이즈 샘플에 조건부이며 에너지 함수에서 구성된 분해능 확산 드리프트 (denoising diffusion drift) 로 회귀합니다. 반면, 확산 모델의 목표는 데이터 샘플에 조건부이며 노이즈 확산 드리프트 (noising diffusion drift) 로 회귀합니다. 우리는 훈련 동안 에너지 함수 평가 횟수를 최소화하기 위해 인터폴란트 과정 (interpolant process) 을 활용하여 정규화되지 않은 밀도에서 샘플링하는 효율적이고 확장 가능한 방법을 도출했습니다. 또한, 우리의 공식은 리만 다양체 (Riemannian manifolds) 에 자연스럽게 확장되어 유클리드 공간 이상의 기하학에서 확산 기반 샘플링을 가능하게 합니다. 우리는 상수 곡률 다양체 (constant curvature manifolds), 즉 초구면 (hyperspheres) 과 쌍곡 공간 (hyperbolic spaces) 에서의 조건부 드리프트에 대한 폐쇄형 공식을 유도했습니다. 우리는 합성 에너지 벤치마크, 작은 펩타이드 (small peptides), 대규모 아모티지드 분자 형태 생성 (large-scale amortized molecular conformer generation), 그리고 구면에서 지원되는 분포를 대상으로 Flow Sampling 을 평가하여 강력한 경험적 성능을 입증했습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0