NVIDIA PiD pixel diffusion 디코딩을 위한 ComfyUI 노드

안녕하세요 여러분 - NVIDIA PiD를 위한 실험적인 ComfyUI 커스텀 노드를 제작했습니다:

PiD는 NVIDIA의 Pixel Diffusion Decoder 방식입니다. 일반적인 VAE 디코딩 (decode) 대신, 잠재 공간에서 이미지로의 디코딩 (latent-to-image decoding)을 조건부 픽셀 확산 (conditional pixel diffusion)으로 처리하여, 디코딩과 업스케일 (upscale)을 하나의 단계로 결합합니다.

이 노드의 기능:

ComfyUI를 위한 PiD Decode 추가
NVIDIA의 현재 PiD 체크포인트 백본 (backbones) 지원: Z-Image, Flux, Flux2, SD3, DINOv2, 그리고 SigLIP
첫 실행 시 PiD 소스/체크포인트/에셋 (assets) 자동 다운로드 가능
PiD 텍스트 프롬프트 (Text Prompt) 헬퍼 노드 포함
중간 잠재 공간/시그마 (intermediate latents/sigma)를 캡처하기 위한 KSampler Capture 노드 포함
낮은 VRAM 워크플로 (workflows)를 위한 단계별 Prepare / Sample / Finalize 노드 포함
PiD Sample은 서브프로세스 (subprocess)에서 실행될 수 있어 샘플링이 끝나면 CUDA 메모리가 해제됨

최상의 2K 품질 모드:

기본 생성 (Base generation): 512 x 512
PiD 체크포인트 (checkpoint): 2k
스케일 (Scale): 4
최종 출력 (Final output): 2048 x 2048

최상의 4K 품질 모드:

기본 생성 (Base generation): 1024 x 1024
PiD 체크포인트 (checkpoint): 2kto4k
스케일 (Scale): 4
최종 출력 (Final output): 4096 x 4096

피드백과 워크플로 예시를 환영합니다.

Insights

NVIDIA PiD pixel diffusion 디코딩을 위한 ComfyUI 노드

요약

핵심 포인트

댓글

MCP를 활용한 코드 실행: '코드 모드(Code Mode)'가 에이전트 토큰 비용을 90% 이상 절감하는 방법

SenseNova-Vision: SenseTime이 공식 오픈소스로 공개한 이해 및 생성 통합 비전 거대 모델

베테랑 전략가가 반도체 주식에 보내는 강력한 경고

Blackstone, 강력한 자금 유입으로 AUM 증가하며 2분기 실적 예상치 상회

MCP를 활용한 코드 실행: '코드 모드(Code Mode)'가 에이전트 토큰 비용을 90% 이상 절감하는 방법

SenseNova-Vision: SenseTime이 공식 오픈소스로 공개한 이해 및 생성 통합 비전 거대 모델

베테랑 전략가가 반도체 주식에 보내는 강력한 경고

Blackstone, 강력한 자금 유입으로 AUM 증가하며 2분기 실적 예상치 상회