arXiv논문2026. 06. 15. 05:23

수정된 역확산 샘플링(Reverse Diffusion Sampling)을 통한 분류기 가이드 확산 모델(Classifier-Guided

요약

표준 분류기 가이드 확산 모델이 희귀 샘플(long-tail)의 커버리지를 저하시키는 문제를 해결하기 위한 새로운 샘플링 방식을 제안합니다. 추가 학습 없이 샘플링 단계에서 밀도 인식형 가이드를 적용하여 데이터 매니폴드에 가까운 고품질 샘플을 생성합니다.

핵심 포인트

분류기 가이드 방식의 롱테일 커버리지 저하 문제 해결
추가 학습 없이 샘플링 단계에서 밀도 인식형 가이드 적용
저확률 샘플 탐색과 실제 데이터 매니폴드 근접을 위한 이중 가이드
ImageNet 실험을 통해 FID 유지 및 재현율(Recall) 향상 입증

확산 모델(Diffusion models)은 특히 분류기 없는 가이드(classifier-free guided) 및 분류기 가이드(classifier-guided) 형태에서 고충실도 이미지 합성을 위한 최첨단 생성 모델로 부상했습니다. 그러나 표준적인 분류기 가이드(classifier guidance)는 확률 질량을 고밀도 클래스 평균 주변에 집중시켜, 클래스 조건부 분포(class-conditional distributions)의 꼬리(tails) 부분에 있는 희귀 샘플의 커버리지를 저하시킵니다. 최근의 확산 기반 꼬리 샘플링(tail sampling) 연구는 합성-대-실제 판별기(synthetic-vs-real discriminator)를 사용하여 추가적인 저밀도 탐색 분류기를 학습시킴으로써 이를 완화하지만, 이는 추가적인 네트워크와 학습 비용을 발생시킵니다. 이와 병행하여, 다수의 샘플러(samplers)와 증류(distillation) 기술들이 확산 샘플링을 가속화하거나 정교화하고 있지만, 롱테일(long-tail) 커버리지를 명시적으로 다루지는 않습니다. 우리는 추가적인 학습 없이도 저밀도 영역을 목표로 하는, 순수하게 샘플링 단계에서 이루어지는 밀도 인식형(density-aware) 분류기 가이드 조건부 확산 모델의 확장 방식을 제안합니다. 우리는 대부분의 확산 모델처럼 예측된 노이즈(predicted noise)가 아닌, 노이즈가 섞인 이미지(noisy images)에 가이드를 적용했습니다. ImageNet에서 사전 학습된 조건부 확산 모델과 분류기를 사용하여, 우리는 수정된 분류기 그래디언트(classifier gradient)를 통해 궤적(trajectories)을 저신뢰(low-confidence) 영역으로 유도함으로써 가이드된 역역학(reverse dynamics)을 수정하며, 각 타임스텝(time step)마다 예측된 실제 이미지(predicted real image)를 향하도록 샘플링 과정을 가이드합니다. 첫 번째 가이드는 저확률 샘플의 탐색을 돕고, 두 번째 가이드는 샘플이 실제 데이터 매니폴드(real data manifold)에 가깝게 생성되도록 돕습니다. 제안된 샘플러는 유사한 FID를 유지하면서 64x64 해상도에서 ADM 모델의 재현율(recall)을 일관되게 향상시켰으며, 256x256 ADM 모델의 경우 두 가이드의 다양한 조합을 통해 결과를 시각적으로 보여주었습니다. 또한, 표준 ADM 분류기 가이드가 예측된 실제 이미지 가이드와 결합될 경우, ImageNet의 256x256 ADM 모델에서 높은 지각적 품질(perceptual quality)의 샘플을 생성하는 데 도움이 된다는 것을 보여주었습니다.

AI 자동 생성 콘텐츠

원문 바로가기

수정된 역확산 샘플링(Reverse Diffusion Sampling)을 통한 분류기 가이드 확산 모델(Classifier-Guided

요약

핵심 포인트

댓글