HN분석2026. 06. 23. 02:33

Moebius: 10B 수준의 성능을 가진 0.2B 이미지 인페인팅 (Inpainting) 모델

요약

Moebius는 0.2B 파라미터 규모로 10B급 성능을 구현한 경량 이미지 인페인팅 모델입니다. LCG가 장착된 LDM 프레임워크와 LλM I 블록을 통해 아키텍처 효율성을 극대화했습니다.

핵심 포인트

0.2B 규모로 10B 수준의 고성능 인페인팅 구현
LCG 기반의 Latent Diffusion Model 프레임워크 채택
LλM I 블록을 통한 디노이징 U-Net의 구조적 재구성
적응형 다중 입도 증류 전략으로 용량 저하 문제 완화

Moebius의 전체 파이프라인 (Overall pipeline). 우리는 Latent Categories Guidance (LCG)가 장착된 Latent Diffusion Model (LDM) 프레임워크를 채택합니다. 극단적인 아키텍처 효율성을 달성하기 위해, 디노이징 (Denoising) U-Net은 우리가 제안하는 LλM I 블록(Sec. 3.2에서 상세 설명)을 사용하여 체계적으로 재구성되었습니다. 또한, 학습 과정에서 적응형 다중 입도 증류 (Adaptive multi-granularity distillation) 전략(Sec. 3.3)을 적용하여 우리의 경량화된 전문가 모델을 고용량 교사 모델 (Teacher model)과 정렬함으로써, 극단적인 구조적 압축으로 인해 발생하는 용량 저하 (Capacity drop) 문제를 성공적으로 완화했습니다.

@misc{DuanAndXu2026Moebius,
title={Moebius: 10B 수준의 성능을 가진 0.2B 경량 이미지 인페인팅 (Inpainting) 프레임워크},
author={Kangsheng Duan and Ziyang Xu and Wenyu Liu and Xiaohu Ruan and Xiaoxin Chen and Xinggang Wang},
...

AI 자동 생성 콘텐츠

원문 바로가기

Moebius: 10B 수준의 성능을 가진 0.2B 이미지 인페인팅 (Inpainting) 모델

요약

핵심 포인트

댓글