arXiv논문2026. 05. 14. 14:24

AnyFlow: On-Policy Flow Map Distillation을 이용한 Any-Step 비디오 확산 모델

요약

AnyFlow는 기존의 Few-step 비디오 생성 기술인 일관성 증류(Consistency Distillation)가 테스트 시 더 많은 샘플링 단계에서 성능 저하를 보이는 한계를 해결하기 위해 제안된 프레임워크입니다. AnyFlow는 모델을 고정된 몇 개의 샘플링 단계에만 증류하는 대신, 전체 ODE 샘플링 궤적을 최적화하여 임의의 시간 간격에 대한 Flow Map 전이 학습으로 전환합니다. 이를 통해 온-정책 증류를 수행하고 테스트 시 이산화 오류 및 노출 편향을 줄여, 샘플링 단계 예산에 따라 성능이 확장되는 Any-step 비디오 확산 모델을 구현했습니다.

핵심 포인트

AnyFlow는 Few-step 비디오 생성의 한계인 샘플링 단계 증가에 따른 성능 저하 문제를 해결합니다.
기존 방식과 달리 전체 ODE 샘플링 궤적을 최적화하는 Flow Map 기반 증류 프레임워크를 사용합니다.
증류 대상을 종단점 일관성 매핑에서 임의 시간 간격에 대한 Flow Map 전이 학습으로 확장했습니다.
Flow Map Backward Simulation을 통해 온-정책 증류를 수행하여 테스트 시 이산화 오류 및 노출 편향을 줄입니다.
1.3B부터 14B 파라미터 규모까지 다양한 아키텍처에서 Few-step 영역의 성능은 물론, 샘플링 단계에 따른 확장성도 입증했습니다.

일관성 증류 (Consistency Distillation)를 통해 몇 단계(Few-step) 비디오 생성 기술이 크게 발전했습니다. 그러나 일관성 증류 모델의 성능은 테스트 시 더 많은 샘플링 단계 (Sampling steps)가 할당될수록 종종 저하되며, 이는 Any-step 비디오 확산 (Any-step video diffusion)을 위한 효과를 제한합니다. 이러한 한계는 일관성 증류가 기존의 확률 흐름 상미분 방정식 (Probability-flow ODE) 궤적을 일관성 샘플링 (Consistency-sampling) 궤적으로 대체함으로써, ODE 샘플링의 바람직한 테스트 시 스케일링 (Test-time scaling) 동작을 약화시키기 때문에 발생합니다.

이러한 한계를 해결하기 위해, 우리는 Flow Map에 기반한 최초의 Any-step 비디오 확산 증류 프레임워크인 AnyFlow를 소개합니다. AnyFlow는 모델을 단지 몇 개의 고정된 샘플링 단계만을 위해 증류하는 대신, 전체 ODE 샘플링 궤적을 최적화합니다. 이를 위해 우리는 증류 대상을 종단점 일관성 매핑 $(z_{t}
ightarrow z_{0})$에서 임의의 시간 간격에 대한 Flow Map 전이 학습 $(z_{t}
ightarrow z_{r})$으로 전환합니다. 나아가 우리는 전체 Euler 롤아웃 (Euler rollout)을 지름길 Flow Map 전이로 분해하는 Flow Map Backward Simulation을 제안하며, 이를 통해 테스트 시 오류(즉, 몇 단계 샘플링에서의 이산화 오류 (Discretization error) 및 인과적 생성 (Causal generation)에서의 노출 편향 (Exposure bias))를 줄이는 효율적인 온-정책 증류 (On-policy distillation)를 가능하게 합니다.

1.3B에서 14B 파라미터 규모에 이르는 양방향 (Bidirectional) 및 인과적 (Causal) 아키텍처 모두에 대한 광범위한 실험을 통해, AnyFlow가 몇 단계 (Few-step) 영역에서는 일관성 기반 모델과 대등하거나 이를 능가하는 성능을 달성하는 동시에, 샘플링 단계 예산에 따라 성능이 확장됨을 입증하였습니다.

AI 자동 생성 콘텐츠

원문 바로가기

AnyFlow: On-Policy Flow Map Distillation을 이용한 Any-Step 비디오 확산 모델

요약

핵심 포인트

댓글