본문으로 건너뛰기

© 2026 Molayo

arXiv중요논문2026. 04. 24. 21:39

확장 가능한 확산 모델 기반 시공간 초해상도 프레임워크

요약

기존의 비디오 초해상도(Super-Resolution) 모델은 특정 공간/시간 배율에 고정되어 있어 다른 조건으로 확장 적용이 어렵다는 한계가 있었습니다. 본 논문에서 제안하는 'Scale-Adaptive Framework'는 이러한 문제를 해결합니다. 이 프레임워크는 시공간 초해상도를 확산 모델(Diffusion Model)과 결정론적 예측을 결합하여 설계했으며, 세 가지 핵심 하이퍼파라미터(노이즈 스케줄 $eta$, 시간 컨텍스트 길이 $L$, 질량 보존 함수 $f$)를 조정함으로써 공간 및 시간 배율에 관계없이 일관되게 작동

핵심 포인트

  • 제안된 프레임워크는 확산 모델과 결정론적 예측을 결합하여 시공간 초해상도를 처리합니다.
  • 이 아키텍처는 세 가지 핵심 하이퍼파라미터(노이즈 스케줄 $eta$, 시간 컨텍스트 길이 $L$, 질량 보존 함수 $f$)를 조정함으로써 다양한 공간 및 시간 배율(예: 1~25, 1~6)에 걸쳐 재사용 가능합니다.
  • 질량 보존 함수($f$)를 추가하여 입력과 출력 간의 총합(aggregated totals)을 유지할 수 있어 물리적 의미가 중요한 기후 데이터 처리에 유용합니다.
  • 실제 예시로 프랑스 지역의 재분석 강수량(reanalysis precipitation over France, Comephore)에 적용되어 높은 확장성을 입증했습니다.

Deep-learning video super-resolution has progressed rapidly, but climate applications typically super-resolve (increase resolution) either space or time, and joint spatiotemporal models are often designed for a single pair of super-resolution (SR) factors (upscaling spatial and temporal ratio between the low-resolution sequence and the high-resolution sequence), limiting transfer across spatial resolutions and temporal cadences (frame rates). We present a scale-adaptive framework that reuses the same architecture across factors by decomposing spatiotemporal SR into a deterministic prediction of the conditional mean, with attention, and a residual conditional diffusion model, with an optional mass-conservation (same precipitation amount in inputs and outputs) transform to preserve aggregated totals. Assuming that larger SR factors primarily increase underdetermination (hence required context and residual uncertainty) rather than changing the conditional-mean structure, scale adaptivity is achieved by retuning three factor-dependent hyperparameters before retraining: the diffusion noise schedule amplitude beta (larger for larger factors to increase diversity), the temporal context length L (set to maintain comparable attention horizons across cadences) and optionally a third, the mass-conservation function f (tapered to limit the amplification of extremes for large factors). Demonstrated on reanalysis precipitation over France (Comephore), the same architecture spans super-resolution factors from 1 to 25 in space and 1 to 6 in time, yielding a reusable architecture and tuning recipe for joint spatiotemporal super-resolution across scales.

AI 자동 생성 콘텐츠

본 콘텐츠는 arXiv cs.AI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
2

댓글

0