내 GPU에서 실행되는 LTX 2.3을 사용하여 무료 AI 비디오를 생성하는 사이트를 구축했습니다
요약
작성자는 LTX 2.3 및 Wan 2.1 같은 오픈 소스 모델을 활용하여 자체 클러스터(GPU 4개 보유 및 필요시 대여)에서 AI 비디오 생성 사이트인 loremotion.com을 구축했습니다. 이 플랫폼은 크레딧이나 구독 제한 없이 Text-to-Video 및 Image-to-Video 기능을 무료로 제공하는 것을 목표로 합니다. 현재 720p/10초 클립의 렌더링 시간은 GPU 성능에 따라 50초에서 110초가 소요되며, 운영비 충당을 위해 광고를 배치했습니다. 다음 개발 계획으로는 Video-to-Video 변환 기능을 추가할 예정입니다.
핵심 포인트
- LTX 2.3 및 Wan 2.1과 같은 오픈 소스 모델을 사용하여 AI 비디오 생성 인프라를 직접 구축함.
- 자체 클러스터와 GPU 대여를 통해 운영 비용을 낮게 유지하며 무료 무제한 생성을 구현함.
- 현재 Text-to-Video 및 Image-to-Video 기능을 720p/10초로 제공하고 있으며, Video-to-Video 변환이 다음 목표임.
- 운영비 충당을 위해 결제창(paywall) 없이 광고를 배치하는 방식을 채택함.
최근 저는 제 프로젝트인 loremotion.com에 매진해 왔습니다. 목표는 단순히 누구나 크레딧, 구독, 또는 제한 없이 AI 비디오를 생성할 수 있도록 하는 것이었습니다. 이를 실제로 가능하게 하기 위해, 저는 API를 건너뛰고 직접 인프라를 구축해야 했습니다.
저는 주로 LTX 2.3 및 Wan 2.1과 같은 오픈 소스 모델 (open-source models)을 사용하고 있습니다. 개인적으로 LTX 2.3(특히 1.1 distilled 버전)이 제가 목표로 하는 속도 대비 가장 좋은 결과를 제공한다는 것을 발견했습니다. 현재 Text-to-Video (텍스트-비디오 변환) 및 Image-to-Video (이미지-비디오 변환) 모두 720p/10초 클립으로 제한을 두었습니다.
하드웨어 설정 (The Hardware Setup): 저는 이것을 저만의 클러스터 (cluster)에서 실행하고 있습니다. 저의 GPU (30 및 40 시리즈) 4개를 보유하고 있으며, 나머지는 필요할 때마다 즉석에서 대여(A100s 및 RTX Pros)합니다. 이는 실제로 비용을 하루 약 8달러 정도로 믿기지 않을 만큼 낮게 유지해 주며, 덕분에 생성 기능을 무료로 유지할 수 있는 것 같습니다. 모두 Wan2GP에 연결되어 있습니다.
성능 (Performance): 어떤 GPU가 작업을 가져가느냐에 따라, 720p 10초 렌더링은 보통 50초에서 110초 사이가 소요됩니다 (생성 시간을 훨씬 더 단축할 수 있는 방법이 있다면 제게 꼭 알려주세요).
기능 (Features):
- 대시보드 (Dashboard): 생성된 클립은 삭제되기 전까지 48시간 동안 보관됩니다.
- 탐색 (Discover): 가장 잘 만들어진 렌더링 결과물을 공개 갤러리에 게시하도록 선택할 수 있습니다.
- 이메일 알림 (Email Alerts): 대기열 (queue)이 밀릴 경우, 이메일을 남겨주시면 작업이 완료되었을 때 알려드립니다.
주의 사항 (The Catch): 운영비를 충당하고 손익분기점을 맞추기 위해 사이트에 광고를 배치해야 했습니다. 광고가 짜증 난다는 점은 알고 있지만, 결제창 (paywall) 없이 무제한 생성을 제공할 수 있는 유일한 방법입니다.
다음 계획은 **Video-to-Video (비디오-비디오 변환)**를 작동시키는 것입니다. 따라서 생성 속도를 개선할 방법, 살펴볼 만한 더 나은 모델, 또는 실제로 원하는 기능에 대한 아이디어가 있다면 제게 알려주세요.
여기에서 확인해 보세요: loremotion.com
AI 자동 생성 콘텐츠
본 콘텐츠는 r/StableDiffusion의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기