내가 비디오 편집자에게 비용을 지불하는 것을 그만두고 대신 AI 공장을 구축한 이유

저는 항상 새벽 2시에 대본을 초안하고, 로열티 프리(royalty-free) 푸티지를 훑어본 뒤, 이 모든 것을 하나로 엮기 위해 프리랜서 비디오 편집자에게 거금을 쓰는 사람이었습니다. 그것은 효과가 있었습니다... 송장이 쌓이기 시작하고 제 사이드 프로젝트 예산이 매달 골칫덩이가 될 때까지는 말이죠. 그때 저는 **AI 비디오 자동화 (AI video automation)**에 대한 기대를 테스트해 보고, "타인에게 비용을 지불하는" 전체 파이프라인을 제가 직접 제어할 수 있는 단일 **n8n 워크플로우 (n8n workflow)**로 대체할 수 있는지 확인하기로 결정했습니다.

아래는 제가 어떻게 월 150달러의 지출을 20달러의 일회성 투자로 바꿨는지, 그 과정에서 겪은 난관은 무엇이었는지, 그리고 왜 이제는 수동적 소득 AI (passive income AI) 스트림을 쫓는 모든 이들에게 자신만의 AI 쇼츠 (AI Shorts) 공장을 구축하는 것을 추천하는지에 대한 솔직한 주간 일기입니다.

1주 차 – "회의적인" 순간

저는 간단한 질문으로 시작했습니다: AI가 인간의 손길 없이 간결한 대본을 쓰고, 관련 이미지를 찾고, 음성 해설(voiceover)을 생성하며, 모든 것을 짧은 비디오로 편집할 수 있을까? 저의 첫 번째 테스트는 "커피 메이커를 청소하는 방법"에 대한 60초짜리 튜토리얼이었습니다. 저는 Notion에 대본을 작성하고, 이를 무료 텍스트 음성 변환(text-to-speech) 도구에 복사한 뒤, 몇 개의 스톡 클립을 수동으로 다운로드했습니다. 30초짜리 클립 하나를 만드는 데 3시간이 걸렸고, 결과물은... 로봇 같았습니다.

**콘텐츠 자동화 (content automation)**의 약속은 서류상으로는 훌륭해 보였지만, 현실은 맞지 않는 오디오 타이밍과 저해상도 스톡 푸티지의 엉망진창인 상태였습니다. 저는 이를 정리하기 위해 전문 편집자가 필요할 것이라고 확신했습니다. 그때부터 저는 완전한 앱을 작성하지 않고도 API를 서로 연결할 수 있게 해주는 오픈 소스 워크플로우 자동화 플랫폼인 n8n을 파고들기 시작했습니다.

2주 차 – n8n 워크플로우를 통한 첫걸음

저는 제 노트북에 로컬 n8n 인스턴스를 설정했고(Docker 덕분에), 작은 파이프라인을 구축하기 시작했습니다:

Trigger (트리거) – GitHub 저장소(repo)에 새로운 마크다운(markdown) 파일이 생성됨.
OpenAI – 헤드라인으로부터 150단어 분량의 스크립트(script) 생성.
Pexels API – 관련 이미지 3~5개 가져오기.
Google Text-to-Speech – 보이스오버(voiceover) 생성.
FFmpeg node (FFmpeg 노드) – 오디오와 이미지를 병합하여 비디오 생성.

전체 과정이 약 45초 만에 실행되었습니다. 마치 새로운 레고(LEGO) 세트를 발견한 아이가 된 기분이었습니다. 저의 첫 결과물은 "고양이가 왜 종이 상자를 좋아하는가"에 대한 10초짜리 "AI 쇼츠(Shorts)" 클립이었습니다. 완벽하지는 않았습니다. 일부 이미지 전환이 갑작스러웠고 목소리가 다소 단조로웠지만, 개념 증명(proof of concept)에는 성공했습니다.

3주 차 – 첫 번째 난관: API 제한 및 타이밍 문제

의욕에 넘쳐 30초 분량의 튜토리얼 시리즈로 규모를 키워보려 했습니다. 그때 두 가지 장애물에 부딪혔습니다:

API 속도 제한 (rate limits) – Pexels는 5번째 호출 이후 이미지 요청을 제한(throttle)했고, Google TTS 할당량(quota)은 몇 분간의 테스트 후 소진되었습니다.
오디오-이미지 동기화 (sync) – 제 FFmpeg 노드가 고정된 프레임 지속 시간(static frame duration)을 사용하고 있어, 마지막 이미지가 사라지기 전에 보이스오버가 먼저 끝나버리는 문제가 발생했습니다.

저는 n8n 문서와 커뮤니티 포럼을 뒤지며 꼬박 하루를 보냈습니다. 해결책은 무엇이었을까요? 요청을 조절하기 위한 **속도 제한 노드 (rate-limit node)**를 추가하고, 각 텍스트 세그먼트(segment)의 길이에 기반한 동적 지속 시간 계산 (dynamic duration calculation) 방식을 사용하는 것이었습니다. 노드가 몇 개 더 추가되었지만, 워크플로우는 훨씬 더 견고해졌습니다.

4주 차 – 자동 비디오 제작 및 스케줄링 추가

기술적인 결함들을 해결한 후, 두 가지 요소를 더 도입했습니다:

자동 비디오 제작 (Automated video production) – FFmpeg 대신 전환 효과, 자막, 브랜딩 오버레이(branding overlays)를 자동으로 처리해 주는 클라우드 기반 비디오 렌더링 서비스(Shotstack)로 교체했습니다.
자동 게시 (Auto-posting) – YouTube, TikTok, Instagram API를 사용하여, 비디오가 렌더링되는 즉시 각 플랫폼에 최종 영상을 업로드하도록 워크플로우를 설정했습니다.

이제 전체 파이프라인(pipeline)은 다음과 같은 모습입니다:

GitHub → OpenAI (스크립트) → Pexels (이미지) → Google TTS (음성) → Shotstack (렌더링) → YouTube/TikTok/IG (게시)

저는 일주일에 3개의 영상을 예약했고, 첫 번째 배치는 어떠한 수동 작업 없이도 라이브로 게시되었습니다. 참여 수치(Engagement)는 각각 수백 회 정도로 완만했지만, 영상 편집당 30~50달러를 더 이상 지불할 필요가 없다는 점에서 **수동적 소득 AI (passive income AI)**로서의 잠재력은 분명했습니다.

5주 차 – 미세 조정(Fine-Tuning) 및 실제 결과

저는 이번 주에 두 가지 주요 측면을 조정하는 데 시간을 보냈습니다:

스크립트 품질 (Script quality) – OpenAI를 위한 프롬프트 엔지니어링 (Prompt engineering)을 통해 스크립트가 더 인간처럼 들리게 만들었습니다. "톤: 친근함, 대화체" 파라미터를 추가하자 시청 시간 (Watch time)이 약 15% 증가했습니다.
썸네일 생성 (Thumbnail generation) – 가장 눈길을 사로잡는 프레임을 추출하고 Canva API를 사용하여 굵은 텍스트를 겹쳐 올리는 추가 노드 (Node)를 추가했습니다. 클릭률 (Click-through rates)이 1.2%에서 2.8%로 상승했습니다.

30일 후, 저의 AI 쇼츠 (AI Shorts) 채널은 평균 250회의 조회수를 기록하는 12개의 영상을 제작했습니다. 총비용은 얼마였을까요? n8n 워크플로 (Workflow)를 위한 일회성 비용 20달러뿐이었습니다 (저는 이를 Gumroad 제품으로 패키징했습니다). 반복적인 프리랜서 비용도, 라이선스 문제로 인한 골칫거리도 없으며, 한 달에 약 12시간의 시간을 되찾았습니다.

6주 차 – "미리 알았더라면 좋았을 것들"

만약 시간을 되돌릴 수 있다면, 처음부터 구축하는 대신 **n8n 워크플로 템플릿 (template n8n workflow)**으로 시작했을 것입니다. 또한, 적절한 모니터링(n8n의 내장 오류 처리 기능을 통해)을 더 일찍 설정했을 것입니다. 처음 TikTok 업로드가 실패했을 때, 하루가 지나서야 이를 인지하여 최적의 게시 시간대를 놓쳤기 때문입니다.

그럼에도 불구하고, 이 여정은 **콘텐츠 자동화 (content automation)**가 마법의 버튼은 아니라는 점을 가르쳐 주었습니다. 여전히 학습 곡선 (Learning curve)이 존재하며 때때로 수동적인 감독이 필요합니다. 하지만 특히 **수동적 소득 AI (passive income AI)**를 찾는 부업가들에게 그 보상은 매우 큽니다.

마치며 – 자신만의 AI 비디오 공장을 구축하세요

저는 여전히 더 긴 포맷을 실험하고 있으며, 자막을 위한 빠른 전사 (transcription) 노드를 추가하고 있지만, 핵심 워크플로는 견고합니다. 만약 영상 편집자에게 비용을 지불하는 것에 지쳤고, 재현 가능하며 저비용인 솔루션을 원한다면, **n8n 워크플로 (n8n workflow)**를 시도해 보기를 강력히 추천합니다.

제가 사용 중인 도구의 이름은 AI Shorts Factory (https://8622430312019.gumroad.com/l/gujqfy)입니다. 이는 20달러의 일회성 비용으로 사용할 수 있는 n8n 워크플로 (n8n workflow)이며, AI 스크립트 생성 (AI script generation), 이미지 검색 (image search), 보이스오버 (voiceover), 비디오 제작 (video production), 그리고 YouTube, TikTok, Instagram으로의 자동 게시 (auto-posting)까지 모든 과정을 처리합니다.

즐거운 자동화 되세요! 🚀

내가 비디오 편집자에게 비용을 지불하는 것을 그만두고 대신 AI 공장을 구축한 이유

요약

핵심 포인트

내가 비디오 편집자에게 비용을 지불하는 것을 그만두고 대신 AI 공장을 구축한 이유

1주 차 – "회의적인" 순간

2주 차 – n8n 워크플로우를 통한 첫걸음

3주 차 – 첫 번째 난관: API 제한 및 타이밍 문제

4주 차 – 자동 비디오 제작 및 스케줄링 추가

5주 차 – 미세 조정(Fine-Tuning) 및 실제 결과

6주 차 – "미리 알았더라면 좋았을 것들"

마치며 – 자신만의 AI 비디오 공장을 구축하세요

댓글