본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 14. 14:24

AnyFlow: On-Policy Flow Map Distillation을 이용한 Any-Step 비디오 확산 모델

요약

AnyFlow는 기존의 Few-step 비디오 생성 기술인 일관성 증류(Consistency Distillation)가 테스트 시 더 많은 샘플링 단계에서 성능 저하를 보이는 한계를 해결하기 위해 제안된 프레임워크입니다. AnyFlow는 모델을 고정된 몇 개의 샘플링 단계에만 증류하는 대신, 전체 ODE 샘플링 궤적을 최적화하여 임의의 시간 간격에 대한 Flow Map 전이 학습으로 전환합니다. 이를 통해 온-정책 증류를 수행하고 테스트 시 이산화 오류 및 노출 편향을 줄여, 샘플링 단계 예산에 따라 성능이 확장되는 Any-step 비디오 확산 모델을 구현했습니다.

핵심 포인트

  • AnyFlow는 Few-step 비디오 생성의 한계인 샘플링 단계 증가에 따른 성능 저하 문제를 해결합니다.
  • 기존 방식과 달리 전체 ODE 샘플링 궤적을 최적화하는 Flow Map 기반 증류 프레임워크를 사용합니다.
  • 증류 대상을 종단점 일관성 매핑에서 임의 시간 간격에 대한 Flow Map 전이 학습으로 확장했습니다.
  • Flow Map Backward Simulation을 통해 온-정책 증류를 수행하여 테스트 시 이산화 오류 및 노출 편향을 줄입니다.
  • 1.3B부터 14B 파라미터 규모까지 다양한 아키텍처에서 Few-step 영역의 성능은 물론, 샘플링 단계에 따른 확장성도 입증했습니다.

일관성 증류 (Consistency Distillation)를 통해 몇 단계(Few-step) 비디오 생성 기술이 크게 발전했습니다. 그러나 일관성 증류 모델의 성능은 테스트 시 더 많은 샘플링 단계 (Sampling steps)가 할당될수록 종종 저하되며, 이는 Any-step 비디오 확산 (Any-step video diffusion)을 위한 효과를 제한합니다. 이러한 한계는 일관성 증류가 기존의 확률 흐름 상미분 방정식 (Probability-flow ODE) 궤적을 일관성 샘플링 (Consistency-sampling) 궤적으로 대체함으로써, ODE 샘플링의 바람직한 테스트 시 스케일링 (Test-time scaling) 동작을 약화시키기 때문에 발생합니다.

이러한 한계를 해결하기 위해, 우리는 Flow Map에 기반한 최초의 Any-step 비디오 확산 증류 프레임워크인 AnyFlow를 소개합니다. AnyFlow는 모델을 단지 몇 개의 고정된 샘플링 단계만을 위해 증류하는 대신, 전체 ODE 샘플링 궤적을 최적화합니다. 이를 위해 우리는 증류 대상을 종단점 일관성 매핑 $(z_{t}
ightarrow z_{0})$에서 임의의 시간 간격에 대한 Flow Map 전이 학습 $(z_{t}
ightarrow z_{r})$으로 전환합니다. 나아가 우리는 전체 Euler 롤아웃 (Euler rollout)을 지름길 Flow Map 전이로 분해하는 Flow Map Backward Simulation을 제안하며, 이를 통해 테스트 시 오류(즉, 몇 단계 샘플링에서의 이산화 오류 (Discretization error) 및 인과적 생성 (Causal generation)에서의 노출 편향 (Exposure bias))를 줄이는 효율적인 온-정책 증류 (On-policy distillation)를 가능하게 합니다.

1.3B에서 14B 파라미터 규모에 이르는 양방향 (Bidirectional) 및 인과적 (Causal) 아키텍처 모두에 대한 광범위한 실험을 통해, AnyFlow가 몇 단계 (Few-step) 영역에서는 일관성 기반 모델과 대등하거나 이를 능가하는 성능을 달성하는 동시에, 샘플링 단계 예산에 따라 성능이 확장됨을 입증하였습니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0