
NVIDIA PiD, 디코딩(Decoding)과 초해상도(Super-resolution)를 하나의 생성 패스(Generative pass)로
요약
NVIDIA가 디코딩과 초해상도를 단일 생성 패스로 통합한 PiD 모델을 공개했습니다. 기존 파이프라인보다 6배 빠르며 소비자용 GPU에서 1초 미만으로 실행되어 효율적인 이미지 생성이 가능합니다.
핵심 포인트
- 디코딩과 초해상도를 하나의 생성 패스로 통합
- 기존 계단식 파이프라인 대비 6배 빠른 속도
- FLUX, SD3 등 다양한 잠재 변수 지원
- PCB 결함 생성 모델을 통한 시각 검사 학습 지원
NVIDIA PiD는 단 4단계 만에 512² 잠재 변수(Latents)를 2048² 이미지로 디코딩(Decoding)합니다.
이 모델은 소비자용 GPU에서 1초 미만으로 실행되며, 계단식 파이프라인(Cascaded pipelines)보다 6배 더 빠르면서도 훨씬 더 나은 디테일을 제공합니다.
논문(Paper):
https://huggingface.co/papers/2605.23902
모델(Model):
https://huggingface.co/nvidia/PiD
프로젝트(Project):
https://research.nvidia.com/labs/sil/projects/pid/
FLUX, FLUX.2, SD3, Z-Image, DINOv2 및 SigLIP 잠재 변수(Latents)를 지원합니다.
또한 ComfyUI에서도 사용할 수 있습니다.
NVIDIA가 방금 Hugging Face에 PCB 결함 생성 모델을 출시했습니다.
깨끗한 이미지와 이진 마스크(Binary mask)로부터 실감 나는 인쇄 회로 기판(Printed-circuit-board) 결함을 생성하세요.
단 8개의 실제 사례만으로 시각 검사(Visual-inspection) 모델을 학습시킬 수 있습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @huggingpapers (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기