본문으로 건너뛰기

© 2026 Molayo

r/StableDiffusion분석2026. 05. 11. 16:54

Wan 2.2와 LTX 2.3 ID-LoRA를 결합한 워크플로우

요약

본 기술 기사는 ComfyUI 환경에서 Wan 2.2의 이미지-투-비디오(I2V) 기능과 LTX 2.3 ID-LoRA를 결합한 고급 워크플로우를 소개합니다. 이 워크플로우는 먼저 Wan 2.2로 초기 비디오 클립을 생성하고, 이후 LTX 2.3을 활용하여 해당 비디오에 오디오(예: 파손 소리)를 추가하며, ID-LoRA를 통해 특정 인물의 실제 목소리를 자연스럽게 입히면서 콘텐츠를 확장하는 과정을 설명합니다.

핵심 포인트

  • Wan 2.2는 이미지 기반의 초기 비디오 생성을 담당하여 시각적 콘텐츠의 기초를 마련합니다.
  • LTX 2.3은 생성된 비디오에 환경음이나 효과음(foley audio)과 같은 오디오 요소를 추가하는 역할을 합니다.
  • ID-LoRA는 특정 인물의 고유한 목소리나 특징을 인식하고 재현하여, 비디오의 몰입도와 현실성을 높입니다.
  • 이 두 기술을 결합함으로써 단순한 영상 생성을 넘어선, 오디오 및 캐릭터 보이스가 통합된 복합적인 미디어 콘텐츠 제작이 가능해집니다.

Wan 2.2 with LTX 2.3 ID-LoRA workflow

이것은 Comfy의 Wan 2.2 이미지-투-비디오(image-to-video) 워크플로우와 Comfy LTX 2.3 ID-LoRA 워크플로우를 결합한 것입니다. 먼저 Wan 2.2를 사용하여 초기 비디오를 만들 수 있으며, 이후 자동으로 LTX 2.3을 통해 Wan 2.2 비디오에 오디오를 추가하고 원하는 다음 내용을 추가하여 Wan 2.2 비디오를 확장합니다.

Wan 2.2 이미지-투-비디오: Crystal Sparkle이 요트 축하를 위해 샴페인 병을 던지는 장면

LTX 2.3이 보트에 대한 병 파손 소리(foley audio)를 Wan 2.2 클립에 추가하고, ID-LoRA가 Crystal Sparkle의 실제 목소리를 추가합니다

워크플로우 링크는 다음과 같습니다: https://huggingface.co/ussaaron/workflows/blob/main/wan2_2_i2v-with-ltx-id-lora.json

AI 자동 생성 콘텐츠

본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0