DASH: 가이드 캘리브레이션이 적용된 컴팩트 확산 모델을 위한 이중 분기 점수 증류 (Dual-Branch Score Distillation)
요약
DASH는 클래스 조건부 확산 모델의 압축 과정에서 발생하는 분류기 없는 가이드(classifier-free guidance) 간극 문제를 해결하기 위한 이중 분기 점수 증류 프레임워크입니다. 독립적인 분기 제약과 TIRT Transfer를 통해 모델 압축 시에도 가이드 충실도와 생성 품질을 효과적으로 보존합니다.
핵심 포인트
- 이중 분기 점수 증류(DASH)로 가이드 간극 문제 해결
- TIRT Transfer를 통한 타임스텝별 중요도 커리큘럼 전이
- 5.9배 압축 시에도 교사 모델과 유사한 높은 품질 유지
- 무조건부 감독이 증류 이득의 60% 이상 기여 확인
클래스 조건부 확산 모델 (class-conditional diffusion models)의 파라미터 압축은 출력 수준 증류 (output-level distillation)에서 아직 충분히 탐구되지 않은 한계를 드러냅니다. 즉, 무조건부 점수 분기 (unconditional score branch)가 비지도 상태로 남아 있어, 학생 모델 (student)에서 분류기 없는 가이드 (classifier-free guidance) 간극이 미결정 상태로 남게 됩니다. 매 디노이징 (denoising) 단계마다 증폭되는 이 간극은 두 분기 모두 동일한 예측값으로 붕괴되는 퇴행적 솔루션을 허용하며, 이로 인해 출력 수준의 훈련 손실 (training loss)이 낮음에도 불구하고 가이드 (guidance)가 효과를 발휘하지 못하게 만듭니다.
본 논문은 두 점수 분기 (score branches)를 독립적으로 감독하는 이중 분기 증류 프레임워크인 DASH를 소개합니다. DASH는 독립적인 분기 제약 (branch constraints)을 통해 각 훈련 샘플에 대한 타겟 분기 출력을 고유하게 지정하며, 조건부 예측을 실제 노이즈 (ground-truth noise)로 정규화하는 앵커 항 (anchor term)을 사용합니다. 또한, 이 프레임워크는 TIRT Transfer를 도입하여 교사 모델 (teacher)의 수렴된 타임스텝별 중요도 커리큘럼 (per-timestep importance curriculum)을 고정된 사전 지식 (frozen prior)으로 학생 모델에 복사함으로써, 제한된 증류 예산 내에서 이를 다시 학습할 필요를 제거합니다.
CIFAR-10 및 CIFAR-100에 대한 실험 결과, 5.9배 압축 시에도 50단계 DDIM 샘플링에서 교사 모델과 4 FID 포인트 이내의 품질을 유지하며, 가이드 충실도 (guidance fidelity)를 잘 보존하면서 처음부터 훈련하는 방식보다 훨씬 뛰어난 성능을 보였습니다. 절제 연구 (Ablation studies)를 통해 무조건부 감독 (unconditional supervision)이 전체 증류 이득의 60% 이상을 차지하는 지배적인 기여 요소임을 확인했습니다. 커리큘럼 전이 (Curriculum transfer)와 앵커 정규화 (anchor regularisation)는 상호 보완적인 이점을 제공하며, 결과적으로 이중 분기 제약이 가이드를 보존하는 압축을 위해 경험적으로 필수적임을 입증했습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기