본문으로 건너뛰기

© 2026 Molayo

arXiv논문2026. 05. 21. 11:53

제어 가능한 이미지 복원을 위한 확률적 보간법(Stochastic Interpolants)에서의 생성과 회귀 분리

요약

DiSI는 확률적 보간법(Stochastic Interpolants)을 생성과 회귀 구성 요소로 분리하여 이미지 복원의 효율성과 충실도를 동시에 해결하는 통합 프레임워크입니다. 이를 통해 단일 모델 내에서 왜곡-지각 트레이드오프를 조절하며, 고품질의 적은 단계 추론(few-step inference)을 가능하게 합니다.

핵심 포인트

  • 생성과 회귀 과정을 독립적으로 분리하여 제어 가능한 이미지 복원 구현
  • Diffusion Models의 생성 능력과 Regression 기반 방식의 픽셀 충실도 결합
  • 단일 모델 내에서 왜곡-지각 트레이드오프(distortion-perception trade-off) 조절 가능
  • 높은 처리량을 보장하는 듀얼 브랜치 U-Net 스타일의 트랜스포머 네트워크 설계
  • 임의의 궤적에 대해 고품질의 적은 단계 추론을 수행하는 통합 샘플러 제공

최근 이미지 복원 (Image Restoration, IR) 분야의 발전은 Diffusion Models (확산 모델) 및 Flow Matching (플로우 매칭)과 같은 생성적 방법론에 의해 크게 주도되어 왔습니다. 이러한 방법론들은 현실적인 질감을 합성하는 데 탁월하지만, 느린 다단계 추론 (multi-step inference)과 저하된 픽셀 충실도 (pixel fidelity)라는 문제를 안고 있습니다. 이와 대조적으로, 전통적인 회귀 (regression) 기반의 IR 방법론들은 이러한 측면에서 매우 뛰어나며, 단일 단계 (single-step)의 효율성과 높은 픽셀 수준의 재구성 충실도를 제공합니다. 이러한 격차를 해소하기 위해, 우리는 기저에 있는 확률적 보간법 (Stochastic Interpolant) 과정을 독립적인 생성 (generation) 및 회귀 (regression) 구성 요소로 분리하는 통합 프레임워크인 DiSI를 제안합니다. 이러한 디커플링 (decoupling)은 DiSI에 놀라운 다재다능함을 부여하여, 순수 회귀 과정에서 완전한 생성 과정으로의 연속적이고 제어 가능한 전환을 가능하게 합니다. 기술적으로, 우리는 두 가지 특정 샘플링 궤적 (sampling trajectories)을 통해 이 프레임워크를 구현하며, 임의의 궤적에 대해 고품질의 적은 단계 추론 (few-step inference)을 수행할 수 있는 통합 샘플러를 함께 제공합니다. 나아가, 우리는 픽셀 공간 (pixel space)에서 듀얼 브랜치 U-Net 스타일의 트랜스포머 (transformer) 네트워크를 설계하여, 높은 처리량 (throughput)을 보장하면서도 전용 브랜치를 통해 조건부 가이드 (conditional guidance)를 강화합니다. 광범위한 실험을 통해 DiSI가 다양한 IR 작업에서 경쟁력 있는 결과를 효율적으로 달성함을 입증하였으며, 동시에 단일 모델 내에서 왜곡-지각 트레이드오프 (distortion-perception trade-off)를 조절할 수 있는 독보적인 추론 시 유연성을 제공함을 보여줍니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.LG의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0