제로에서 매일 콘텐츠 생산까지: 나의 AI 자동화 여정
요약
n8n과 다양한 AI 도구를 활용하여 아이디어 구상부터 영상 제작 및 플랫폼 업로드까지 이어지는 콘텐츠 자동화 파이프라인 구축 과정을 다룹니다. OpenAI, FFmpeg, Google Cloud TTS 등을 결합하여 효율적인 AI 쇼츠 제작 워크플로우를 만드는 방법을 설명합니다.
핵심 포인트
- n8n과 Docker를 활용한 로컬 자동화 환경 구축
- LLM 스크립트 생성부터 FFmpeg 비디오 조립까지의 파이프라인 설계
- Unsplash 및 API를 이용한 이미지 및 영상 소스 자동 확보
- YouTube, TikTok 등 SNS 자동 업로드 워크플로우 구현
제로에서 매일 콘텐츠 생산까지: 나의 AI 자동화 여정
내가 직면했던 문제
지난 1년 동안 YouTube, TikTok, Instagram에 꾸준히 영상을 올리려고 노력해 왔지만, 현실은 꽤 가혹했습니다. 아이디어를 구상하는 데 3~4시간을 쓰고, 편집에 또 2시간을 보낸 뒤, 그다음은 무엇을 해야 할지 모르는 공포스러운 패닉 상태에 빠지곤 했습니다. 나의 사이드 허슬(side hustle)은 마치 파트타임 직업처럼 느껴졌고, 수치는 그 노력을 정당화할 만큼 빠르게 성장하지 않았습니다. 나는 **AI 비디오 자동화 (AI video automation)**를 구글링하기 시작했고, AI 쇼츠 (AI Shorts), 자동화된 비디오 제작 (automated video production), _콘텐츠 자동화 (content automation)_와 같은 몇 가지 유행어들을 발견했습니다. 하지만 모든 솔루션은 너무 비싸거나, 내가 보유하지 않은 개발 팀을 필요로 하는 것처럼 보였습니다.
그때 이런 생각이 들었습니다. 몇 가지 무료 도구와 **n8n 워크플로우 (n8n workflow)**를 결합하여 대부분의 힘든 작업을 처리할 수 있다면 어떨까? 회의적이기도 했지만, "수동적 소득 AI (passive income AI)"라는 약속은 무시하기에는 너무나 매력적이었습니다.
n8n을 통한 첫 걸음
1주 차는 온통 조사에 집중했습니다. 나는 n8n을 로컬에 설치했고 (Docker 덕분에 수월했습니다), 아이디어에서 게시물 발행까지 비디오가 거쳐야 하는 단계들을 설계하기 시작했습니다:
- LLM(대규모 언어 모델)으로 스크립트 생성.
- 저작권 없는 이미지 또는 짧은 클립 찾기.
- 스크립트를 보이스오버(voiceover)로 변환.
- 모든 것을 세로형 비디오로 결합.
- YouTube Shorts, TikTok, Instagram Reels에 업로드.
나는 OpenAI, Unsplash, FFmpeg를 위한 몇 가지 커뮤니티 노드(community nodes)를 찾았지만, 어느 것도 서로 연결되어 있지는 않았습니다. 나는 시드 키워드(seed keyword)를 입력받아 OpenAI API를 호출하여 60초 분량의 스크립트를 생성한 다음, 그 스크립트를 텍스트 음성 변환(text-to-speech) 서비스(Google Cloud TTS)로 전달하는 콘텐츠 자동화 (content automation) 파이프라인을 구축했습니다. 첫 실행 결과는 엉망인 보이스오버가 생성되었습니다. 언어 코드를 올바르게 설정하지 않았던 것입니다. 그것이 나의 첫 번째 작은 좌절이었습니다.
AI 쇼츠 파이프라인 구축하기
2주 차 말쯤에는 인간 수준의 다듬기 과정은 제외하더라도, 약 7분 만에 짧은 영상을 만들 수 있는 거친 프로토타입을 갖추게 되었습니다. 내가 원하는 AI 쇼츠 (AI Shorts) 품질에 도달하기 위해, 나는 몇 가지 노드를 더 추가했습니다:
- 이미지 검색 (Image Search): Unsplash 노드가 각 단락을 기반으로 관련 있는 이미지 3개를 가져왔습니다. 이미지 위에 자막을 겹치게 하기 위해 아주 작은 JavaScript 함수를 작성했습니다.
- 비디오 조립 (Video Assembly): FFmpeg가 음성 해설 (Voiceover), 이미지, 그리고 배경 음악 트랙을 결합했습니다. 세로 형식을 강제하기 위해
scale=720:1280플래그를 사용했습니다. - 자동 게시 (Auto‑Posting): n8n의 YouTube API 노드가 업로드를 처리했고, 나머지 두 플랫폼을 위해서는 서드파티 TikTok API 래퍼 (아직 베타 버전)를 사용했습니다.
이 모든 과정은 내 노트북에서 실행되었으며, 전체 흐름은 간단한 HTTP 요청으로 실행할 수 있는 재사용 가능한 **n8n 워크플로우 (n8n workflow)**로 저장되었습니다. 나는 매일 밤 내가 큐레이션한 Google Sheet에서 새로운 키워드를 가져와 24시간마다 워크플로우를 실행하도록 크론 잡 (cron job)을 설정했습니다.
시행착오와 미세 조정 (Setbacks and Tweaks)
파이프라인이 가동된 후에도, 잠시 멈춰서 다시 생각하게 만든 몇 가지 문제에 부딪혔습니다:
- 음성 품질 문제 (Voice Quality Issues): 처음 몇 개의 음성 해설은 로봇처럼 들렸습니다. 나는 무료 티어에서 프리미엄 “WaveNet” 음성으로 전환했는데, 이는 1,000자당 약 0.02달러가 추가되었지만 성우를 고용하는 것에 비하면 여전히 저렴했습니다.
- 플랫폼 속도 제한 (Platform Rate Limits): TikTok의 업로드 엔드포인트가 영상 3개를 연속으로 올린 후 나를 제한(throttle)했습니다. 나는 지연 노드 (delay node)를 추가하고 일일 출력량을 플랫폼당 영상 2개로 제한했으며, 이는 가장 성과가 좋은 키워드를 우선순위에 두어야 함을 의미했습니다.
이러한 시행착오로 인해 매주 약 2~3시간의 추가 시간이 소요되었지만, 프로세스는 훨씬 더 안정적이 되었습니다.
30일 후의 결과 (Results after 30 Days)
한 달간의 **자동 비디오 제작 (automated video production)**을 거친 후, 수치들이 유망해 보이기 시작했습니다:
- 조회수 (Views): 모든 플랫폼 합계 총 12,800회, YouTube Shorts가 가장 높은 CPM (Cost Per Mille)을 기록했습니다.
- 팔로워 (Followers): Instagram 팔로워 +1,400명, TikTok 팔로워 +800명 증가했으며, 대부분이 매일 업로드되는 콘텐츠와 상호작용했습니다.
- 절약된 시간 (Time Saved): 영상 하나당 약 6시간이 걸리던 수동 작업이 15분 미만의 감독 (oversight) 작업으로 줄어들었습니다. 덕분에 저녁 시간을 본업과 개인적인 취미(기타 배우기)에 할애할 수 있었습니다.
- AI 패시브 인컴 (Passive Income AI): Shorts의 광고 수익은 하루 평균 3.50달러였으며, 이는 OpenAI 및 TTS (Text-to-Speech) API의 적은 비용을 충당하고도 약간의 이윤을 남겼습니다.
또한 완벽함보다 일관성이 더 중요하다는 것을 깨달았습니다. AI Shorts 형식은 몇몇 영상이
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기