본문으로 건너뛰기

© 2026 Molayo

r/StableDiffusion분석2026. 05. 27. 06:13

전체 AI 애니메이션 파이프라인을 구축하여 5일 만에 2.5분 분량의 애니메이션 쇼 제작 (Qwen, Flux, LTXV)

요약

Qwen, Flux, LTXV 등 다양한 AI 모델을 활용하여 5일 만에 2.5분 분량의 애니메이션 쇼를 제작한 파이프라인을 소개합니다. 기존 방식과 달리 기획 단계부터 AI를 전면 도입하여 스타일 일관성과 캐릭터 구현을 최적화했습니다.

핵심 포인트

  • Style LoRA 학습을 통한 시각적 언어 및 스타일 일관성 유지
  • Qwen과 Flux를 조합한 정교한 캐릭터 얼굴 및 의상 생성
  • 목소리 선제작 후 대사와 연기에 맞춘 애니메이션 가이드 방식
  • LTXV 2.3을 활용한 최종 비디오 생성 파이프라인 구축

지난 몇 달 동안 저는 주요 애니메이션 스튜디오들과 AI 통합 작업을 진행해 왔습니다. 제가 계속해서 목격한 패턴은 기존 파이프라인의 마지막 단계에 AI를 연결하는 방식이었습니다. 스크립트와 스토리보드는 인간이 작성하고, 최종 애니메이션 패스(final animation pass)에만 AI를 사용하는 식이었죠.

저는 그 반대, 즉 처음부터 AI가 개입하는 방식을 테스트해보고 싶었습니다.

파이프라인:

  • Ligne Claire를 참조로 하여 약 20장의 이미지를 사용하여 AI Toolkit에서 Style LoRA를 학습시켰습니다. 특정 캐릭터에 집중하기보다는 시각적 언어(visual language)에 초점을 맞췄습니다. 소스를 그대로 복제하지 않으면서 스타일 일관성을 유지하기 위해 추론(inference) 시 LoRA 강도를 1.0 미만으로 유지했습니다.
  • 얼굴은 Qwen Image Edit 2511을 사용하여 생성했으며, 닮은꼴이 나오는 것을 방지하기 위해 유명인 참조와 국적/특징 태그를 사용했습니다.
  • 전신과 의상은 Flux.2 Klein 9B에서 정교화했습니다.
  • 배경에는 실제 사무실 참조 이미지를 입력값으로 사용하여 동일한 Ligne Claire LoRA를 적용했습니다.
  • 목소리는 ElevenLabs Voice Design을 사용했습니다. 프리셋 없이 캐릭터별로 맞춤형 프롬프트를 사용했습니다.
  • 전통적인 스토리보드는 사용하지 않았습니다. 애니메틱(animatic)보다 목소리가 먼저 제작되었습니다. 애니메이션은 대사와 연기에 의해 가이드되었습니다.
  • 최종 비디오 생성은 LTXV 2.3으로 진행했습니다.

8명의 캐릭터 (첫 에피소드에는 3명 등장). 5일 소요. 혼자서 작업.

쇼의 제목은 Everything's SLOP이며, AI, 업무, 그리고 모든 것이 괜찮은 척하는 사람들에 대한 기업 풍자극입니다.

EP01이 공개되었습니다. 제작 과정(Making of) 영상도 곧 공개될 예정입니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0