NVIDIA PiD pixel diffusion 디코딩을 위한 ComfyUI 노드
요약
NVIDIA의 PiD(Pixel Diffusion Decoder) 방식을 지원하는 실험적인 ComfyUI 커스텀 노드를 소개합니다. 이 노드는 디코딩과 업스케일을 하나의 단계로 결합하여 고해상도 이미지를 생성하며, 다양한 백본 모델을 지원합니다.
핵심 포인트
- NVIDIA PiD 기반의 Latent-to-Image 디코딩 지원
- Flux, SD3, DINOv2 등 다양한 체크포인트 백본 지원
- 2K 및 4K 고해상도 품질 모드 제공
- VRAM 효율을 위한 단계별 노드 및 서브프로세스 실행 기능
- 텍스트 프롬프트 헬퍼 및 KSampler 캡처 노드 포함
안녕하세요 여러분 - NVIDIA PiD를 위한 실험적인 ComfyUI 커스텀 노드를 제작했습니다:
PiD는 NVIDIA의 Pixel Diffusion Decoder 방식입니다. 일반적인 VAE 디코딩 (decode) 대신, 잠재 공간에서 이미지로의 디코딩 (latent-to-image decoding)을 조건부 픽셀 확산 (conditional pixel diffusion)으로 처리하여, 디코딩과 업스케일 (upscale)을 하나의 단계로 결합합니다.
이 노드의 기능:
- ComfyUI를 위한 PiD Decode 추가
- NVIDIA의 현재 PiD 체크포인트 백본 (backbones) 지원: Z-Image, Flux, Flux2, SD3, DINOv2, 그리고 SigLIP
- 첫 실행 시 PiD 소스/체크포인트/에셋 (assets) 자동 다운로드 가능
- PiD 텍스트 프롬프트 (Text Prompt) 헬퍼 노드 포함
- 중간 잠재 공간/시그마 (intermediate latents/sigma)를 캡처하기 위한 KSampler Capture 노드 포함
- 낮은 VRAM 워크플로 (workflows)를 위한 단계별 Prepare / Sample / Finalize 노드 포함
- PiD Sample은 서브프로세스 (subprocess)에서 실행될 수 있어 샘플링이 끝나면 CUDA 메모리가 해제됨
최상의 2K 품질 모드:
- 기본 생성 (Base generation): 512 x 512
- PiD 체크포인트 (checkpoint): 2k
- 스케일 (Scale): 4
- 최종 출력 (Final output): 2048 x 2048
최상의 4K 품질 모드:
- 기본 생성 (Base generation): 1024 x 1024
- PiD 체크포인트 (checkpoint): 2kto4k
- 스케일 (Scale): 4
- 최종 출력 (Final output): 4096 x 4096
피드백과 워크플로 예시를 환영합니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기