NVIDIA PiD, 디코딩(Decoding)과 초해상도(Super-resolution)를 하나의 생성 패스(Generative pass)로

NVIDIA PiD는 단 4단계 만에 512² 잠재 변수(Latents)를 2048² 이미지로 디코딩(Decoding)합니다.

이 모델은 소비자용 GPU에서 1초 미만으로 실행되며, 계단식 파이프라인(Cascaded pipelines)보다 6배 더 빠르면서도 훨씬 더 나은 디테일을 제공합니다.

FLUX, FLUX.2, SD3, Z-Image, DINOv2 및 SigLIP 잠재 변수(Latents)를 지원합니다.
또한 ComfyUI에서도 사용할 수 있습니다.

NVIDIA가 방금 Hugging Face에 PCB 결함 생성 모델을 출시했습니다.

깨끗한 이미지와 이진 마스크(Binary mask)로부터 실감 나는 인쇄 회로 기판(Printed-circuit-board) 결함을 생성하세요.

단 8개의 실제 사례만으로 시각 검사(Visual-inspection) 모델을 학습시킬 수 있습니다.

Insights