본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 20. 12:03

확률 보존 흐름 가이드 (Probability-Conserving Flow Guidance)

요약

기존의 Classifier-Free Guidance(CFG) 방식이 생성 매니폴드의 기하학적 구조를 무시하여 확률 보존을 깨뜨리는 문제를 분석합니다. 본 연구는 연속 방정식을 통해 가이드 효과를 점수 평행 항과 발산 항으로 분해하고, 이를 제어하는 적응형 매니폴드 가이드(AdaMaG)를 제안합니다. AdaMaG는 추가 비용 없이 이미지의 사실성을 높이고 환각 현상을 줄이며 채도 저하 문제를 개선합니다.

핵심 포인트

  • 기존 CFG 방식은 확률 보존을 깨뜨려 샘플을 학습된 매니폴드 밖으로 밀어내는 한계가 있음
  • 가이드 효과를 연속 방정식을 기반으로 점수 평행 항(Score-parallel term)과 발산 항(Divergence term)으로 분해 가능함을 증명
  • 샘플링 과정에서 발산 항이 구조적으로 폭발하는 문제를 해결하기 위해 시간 의존적 스케줄링의 필요성 제시
  • 추가 추론 비용 없이 적용 가능한 적응형 매니폴드 가이드(AdaMaG)를 통해 생성 품질 및 사실성 향상

확산 모델 (Diffusion models) 및 흐름 기반 생성 모델 (Flow-based generative models)은 시각적 합성 분야를 주도하고 있으며, 가이드 (Guidance) 기술은 샘플을 사용자 입력에 맞추고 지각적 품질 (Perceptual quality)을 향상시키는 역할을 합니다. 그러나 분류기 없는 가이드 (Classifier-Free Guidance, CFG) 및 외삽 기반 (Extrapolation-based) 방법들은 속도/점수 (Velocities/scores)의 휴리스틱한 선형 결합으로, 생성 매니폴드 (Generative manifold)의 기하학적 구조를 무시합니다. 이는 확률 보존 (Probability conservation)을 깨뜨리고, 강한 가이드 조건에서 샘플을 학습된 매니폴드 밖으로 밀어냅니다. 본 연구에서는 연속 방정식 (Continuity equation)을 통해 가이드를 분석하며, 그 효과가 발산 항 (Divergence term)과 매개변수화 (Parameterisations)에 관계없이 불변하게 정의되는 점수 평행 항 (Score-parallel term)으로 분해됨을 보여줍니다. 우리는 샘플링이 데이터 매니폴드 (Data manifold)에 접근함에 따라 발산 항이 구조적으로 폭발한다는 것을 증명하며, 이를 바탕으로 점수 평행 감쇠 (Score-parallel attenuation)와 함께 시간 의존적 스케줄 (Time-dependent schedule)의 필요성을 제시합니다. 그 결과로 도출된 플러그 앤 플레이 (Plug-and-play) 규칙인 적응형 매니폴드 가이드 (Adaptive Manifold Guidance, AdaMaG)는 추가적인 추론 비용 없이 두 항을 모두 제한합니다. 마지막으로, 채도 저하 (Saturation)를 줄이거나 생성 품질을 개선하기 위한 대부분의 경험적 휴리스틱이 우리의 분해 과정에 나타난 두 항과 직접적으로 대응됨을 보여줍니다. 이미지 생성 벤치마크 전반에 걸쳐, AdaMaG는 사실성을 향상시키고, 환각 (Hallucinations)을 줄이며, 높은 가이드 영역에서 제어된 채도 감소 (Desaturation)를 유도합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0