본문으로 건너뛰기

© 2026 Molayo

Dev.to헤드라인2026. 05. 30. 17:11

제로에서 매일 콘텐츠 생산까지: 나의 AI 자동화 여정

요약

n8n과 다양한 AI 도구를 활용하여 아이디어 구상부터 영상 제작 및 플랫폼 업로드까지 이어지는 콘텐츠 자동화 파이프라인 구축 과정을 다룹니다. OpenAI, FFmpeg, Google Cloud TTS 등을 결합하여 효율적인 AI 쇼츠 제작 워크플로우를 만드는 방법을 설명합니다.

핵심 포인트

  • n8n과 Docker를 활용한 로컬 자동화 환경 구축
  • LLM 스크립트 생성부터 FFmpeg 비디오 조립까지의 파이프라인 설계
  • Unsplash 및 API를 이용한 이미지 및 영상 소스 자동 확보
  • YouTube, TikTok 등 SNS 자동 업로드 워크플로우 구현

제로에서 매일 콘텐츠 생산까지: 나의 AI 자동화 여정

내가 직면했던 문제

지난 1년 동안 YouTube, TikTok, Instagram에 꾸준히 영상을 올리려고 노력해 왔지만, 현실은 꽤 가혹했습니다. 아이디어를 구상하는 데 3~4시간을 쓰고, 편집에 또 2시간을 보낸 뒤, 그다음은 무엇을 해야 할지 모르는 공포스러운 패닉 상태에 빠지곤 했습니다. 나의 사이드 허슬(side hustle)은 마치 파트타임 직업처럼 느껴졌고, 수치는 그 노력을 정당화할 만큼 빠르게 성장하지 않았습니다. 나는 **AI 비디오 자동화 (AI video automation)**를 구글링하기 시작했고, AI 쇼츠 (AI Shorts), 자동화된 비디오 제작 (automated video production), _콘텐츠 자동화 (content automation)_와 같은 몇 가지 유행어들을 발견했습니다. 하지만 모든 솔루션은 너무 비싸거나, 내가 보유하지 않은 개발 팀을 필요로 하는 것처럼 보였습니다.

그때 이런 생각이 들었습니다. 몇 가지 무료 도구와 **n8n 워크플로우 (n8n workflow)**를 결합하여 대부분의 힘든 작업을 처리할 수 있다면 어떨까? 회의적이기도 했지만, "수동적 소득 AI (passive income AI)"라는 약속은 무시하기에는 너무나 매력적이었습니다.

n8n을 통한 첫 걸음

1주 차는 온통 조사에 집중했습니다. 나는 n8n을 로컬에 설치했고 (Docker 덕분에 수월했습니다), 아이디어에서 게시물 발행까지 비디오가 거쳐야 하는 단계들을 설계하기 시작했습니다:

  1. LLM(대규모 언어 모델)으로 스크립트 생성.
  2. 저작권 없는 이미지 또는 짧은 클립 찾기.
  3. 스크립트를 보이스오버(voiceover)로 변환.
  4. 모든 것을 세로형 비디오로 결합.
  5. YouTube Shorts, TikTok, Instagram Reels에 업로드.

나는 OpenAI, Unsplash, FFmpeg를 위한 몇 가지 커뮤니티 노드(community nodes)를 찾았지만, 어느 것도 서로 연결되어 있지는 않았습니다. 나는 시드 키워드(seed keyword)를 입력받아 OpenAI API를 호출하여 60초 분량의 스크립트를 생성한 다음, 그 스크립트를 텍스트 음성 변환(text-to-speech) 서비스(Google Cloud TTS)로 전달하는 콘텐츠 자동화 (content automation) 파이프라인을 구축했습니다. 첫 실행 결과는 엉망인 보이스오버가 생성되었습니다. 언어 코드를 올바르게 설정하지 않았던 것입니다. 그것이 나의 첫 번째 작은 좌절이었습니다.

AI 쇼츠 파이프라인 구축하기

2주 차 말쯤에는 인간 수준의 다듬기 과정은 제외하더라도, 약 7분 만에 짧은 영상을 만들 수 있는 거친 프로토타입을 갖추게 되었습니다. 내가 원하는 AI 쇼츠 (AI Shorts) 품질에 도달하기 위해, 나는 몇 가지 노드를 더 추가했습니다:

  • 이미지 검색 (Image Search): Unsplash 노드가 각 단락을 기반으로 관련 있는 이미지 3개를 가져왔습니다. 이미지 위에 자막을 겹치게 하기 위해 아주 작은 JavaScript 함수를 작성했습니다.
  • 비디오 조립 (Video Assembly): FFmpeg가 음성 해설 (Voiceover), 이미지, 그리고 배경 음악 트랙을 결합했습니다. 세로 형식을 강제하기 위해 scale=720:1280 플래그를 사용했습니다.
  • 자동 게시 (Auto‑Posting): n8n의 YouTube API 노드가 업로드를 처리했고, 나머지 두 플랫폼을 위해서는 서드파티 TikTok API 래퍼 (아직 베타 버전)를 사용했습니다.

이 모든 과정은 내 노트북에서 실행되었으며, 전체 흐름은 간단한 HTTP 요청으로 실행할 수 있는 재사용 가능한 **n8n 워크플로우 (n8n workflow)**로 저장되었습니다. 나는 매일 밤 내가 큐레이션한 Google Sheet에서 새로운 키워드를 가져와 24시간마다 워크플로우를 실행하도록 크론 잡 (cron job)을 설정했습니다.

시행착오와 미세 조정 (Setbacks and Tweaks)

파이프라인이 가동된 후에도, 잠시 멈춰서 다시 생각하게 만든 몇 가지 문제에 부딪혔습니다:

  1. 음성 품질 문제 (Voice Quality Issues): 처음 몇 개의 음성 해설은 로봇처럼 들렸습니다. 나는 무료 티어에서 프리미엄 “WaveNet” 음성으로 전환했는데, 이는 1,000자당 약 0.02달러가 추가되었지만 성우를 고용하는 것에 비하면 여전히 저렴했습니다.
  2. 플랫폼 속도 제한 (Platform Rate Limits): TikTok의 업로드 엔드포인트가 영상 3개를 연속으로 올린 후 나를 제한(throttle)했습니다. 나는 지연 노드 (delay node)를 추가하고 일일 출력량을 플랫폼당 영상 2개로 제한했으며, 이는 가장 성과가 좋은 키워드를 우선순위에 두어야 함을 의미했습니다.

이러한 시행착오로 인해 매주 약 2~3시간의 추가 시간이 소요되었지만, 프로세스는 훨씬 더 안정적이 되었습니다.

30일 후의 결과 (Results after 30 Days)

한 달간의 **자동 비디오 제작 (automated video production)**을 거친 후, 수치들이 유망해 보이기 시작했습니다:

  • 조회수 (Views): 모든 플랫폼 합계 총 12,800회, YouTube Shorts가 가장 높은 CPM (Cost Per Mille)을 기록했습니다.
  • 팔로워 (Followers): Instagram 팔로워 +1,400명, TikTok 팔로워 +800명 증가했으며, 대부분이 매일 업로드되는 콘텐츠와 상호작용했습니다.
  • 절약된 시간 (Time Saved): 영상 하나당 약 6시간이 걸리던 수동 작업이 15분 미만의 감독 (oversight) 작업으로 줄어들었습니다. 덕분에 저녁 시간을 본업과 개인적인 취미(기타 배우기)에 할애할 수 있었습니다.
  • AI 패시브 인컴 (Passive Income AI): Shorts의 광고 수익은 하루 평균 3.50달러였으며, 이는 OpenAI 및 TTS (Text-to-Speech) API의 적은 비용을 충당하고도 약간의 이윤을 남겼습니다.

또한 완벽함보다 일관성이 더 중요하다는 것을 깨달았습니다. AI Shorts 형식은 몇몇 영상이

AI 자동 생성 콘텐츠

본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0