Zero to Autopilot, Part 8: 25달러짜리 회사 — 내 채널을 운영하는 AI 에이전트 조직 - Insights | Molayo

시리즈: Zero to Autopilot — 자기 개선형 AI 미디어 채널 구축. Part 8. Part 1에서 채널을 구축했고, Part 2~7에서 채널이 스스로 돌아가게 만들었습니다 (피날레: Part 7). 이번 파트에서는 단일 루프를 채널을 관리하는 **에이전트 조직 (Org of agents)**으로 교체합니다.

데이터 상태: 현재 실시간 — 비용, 코드, 아키텍처(Architecture), 그리고 정성적 결과물 모두 오늘 기준으로 측정되었습니다. 저장소(Repo)는 오픈 소스입니다.

어느 날 아침, 아무런 기대 없이 대시보드를 열었는데 밤사이 이미 영상 3개가 배포되어 있었습니다. 스크립트(Scripts) 작성, 장면 렌더링(Rendered), 음성 생성(Voiced), 자막 삽입(Captioned), QA(품질 보증)를 거쳐 YouTube에 게시까지 완료되었습니다. 저는 아무것도 건드리지 않았습니다. 저를 기다리는 알림도 없었습니다. 작업 과정 중 어느 시점에서도 인간의 개입이 필요하지 않았기 때문입니다. 오전 9시의 업무가 시작되었고, 몇몇 에이전트들이 서로 업무를 전달했으며, 제가 확인했을 때는 이미 완료된 상태였습니다.

제가 설명하고자 하는 것은 바로 이 시스템입니다. 영상 자체가 아니라, 영상을 만드는 조직(Org)에 대해서 말이죠.

이것이 무엇인가

저는 얼굴이 나오지 않는(Faceless) AI YouTube Shorts 채널을 운영합니다. 소프트웨어가 모든 것을 수행합니다. 주제를 선정하고, 60초 분량의 스크립트를 작성하며, 키프레임(Keyframes)과 모션(Motion)을 생성하고, 음성(Voiceover)을 합성하며, 오디오를 믹싱하고, 업로드까지 합니다. 전체 운영 비용은 한 달에 약 25달러 정도이며, CEO, 성장 리드(Growth lead), QA 비평가(QA critic), 프로듀서(Producer) 등 실제 회사와 같은 구조로 이루어져 있습니다.

한동안 이 시스템의 두뇌는 단일 루프였습니다. 타이머에 맞춰 작동하는 하나의 함수가 아이디어 구상(Ideate) → 제작(Produce) → 측정(Measure) → 학습(Learn) 과정을 거치며 매 틱(Tick)마다 다음 행동을 결정하는 방식이었습니다. 작동은 잘 되었습니다. 하지만 판단력(Judgment)은 없었습니다.

하나의 프로세스가 모든 것을 수행했기에, 그 무엇도 검증하지 못한다는 의미였습니다. 스크립트를 작성한 주체가 렌더링에 비용을 지불할 만큼 스크립트가 충분히 괜찮은지 결정하는 주체와 동일했습니다. 버그를 발견하거나 예산을 재검토하는 일은 결코 없었습니다. 그저 if 문(if-statements)을 실행하고 거기서 멈췄을 뿐입니다.

그래서 저는 그 루프(loop)를 하나의 회사로 교체했습니다.

[

]

단 하나의 목표

회사

이제 두뇌는 Paperclip 위에서 실행되는 8개의 역할 특화 LLM 에이전트(LLM agents)입니다. Paperclip은 각 에이전트에게 정체성, 작업 수신함(task inbox), 그리고 다른 에이전트에게 업무를 넘길 수 있는 능력을 부여하는 작은 로컬 런타임(local runtime)입니다. 이들은 자유분방하게 채팅하는 것이 아니라, 실제 팀처럼 티켓(tickets)을 전달하며 협업합니다.

[

]

각 에이전트가 실제로 담당하는 역할은 다음과 같습니다:

CEO / 운영자 (Operator). 이사회 역할을 합니다. 회사 목표(저에게는 수익화 달성), 예산 한도, 그리고 발행 정책을 소유합니다. 지출 및 정책 변경을 승인하고 방향에 대한 최종 결정을 내립니다. 다른 에이전트들은 여기서 의사결정을 상향 보고하며, 스스로 글을 쓰거나 렌더링하는 작업은 하지 않습니다. (Sonnet 4.6.)
성장 담당자 (Growth Lead). 기획자이자 관리자에 가장 가깝습니다. 매 주기마다 채널의 상태를 읽고 현재 가장 유용한 단 하나의 움직임을 결정합니다: 무언가를 만들지, 성숙한 비디오를 측정할지, 아니면 반추하고 전략을 업데이트할지입니다. '만들기'일 경우, 백로그에서 어떤 베팅을 선택하고 SEO 프레이밍(제목 후보, 후크 약속, 타겟 키워드)을 작성한 뒤, 그 베팅을 시나리오 작가에게 넘깁니다. (Sonnet 4.6.)
시나리오 작가 (Screenwriter). 한 줄짜리 베팅을 실제 스크립트로 만듭니다: 처음 3초 안에 들어오는 후크, 실제로 설명되는 구체적인 아이디어 하나, 그리고 렌더러가 사용할 수 있는 시각적 프롬프트입니다. QA에서 반려하면, 특정 지침에 맞춰 재작성합니다. (Opus 4.8, 스크립트 품질이 제품이기 때문입니다.)
QA / 비평가 (Critic). 독립적인 관문이며, 제가 이 시스템을 신뢰하는 이유입니다. 두 번 실행됩니다: 첫 번째는 돈이 쓰이기 전에 스크립트에 대해 (후크가 진짜인지, 보상이 있는지, 제목이 과장하지 않았는지, 프롬프트가 렌더링하기에 안전한지), 그리고 두 번째는 발행 전 최종 비디오에 대해 (재생되는지, 오디오가 깨끗한지, 메타데이터가 일치하는지)입니다. 이 관문 중 어느 쪽이든 막고 작업을 되돌려 보낼 수 있습니다. (Opus 4.8.)
프로듀서 (Producer). 통과된 스크립트를 완성되고 발행된 비디오로 만듭니다. 전체 렌더 파이프라인(키프레임, 모션 클립, 스티칭, 사운드, 음성, 마스터, 메타데이터)을 실행하고, YouTube에 게시하며, 나중에 측정할 수 있도록 그 결과를 채널 저널에 연결합니다. 예산 한도 내에서 작동합니다. (Sonnet 4.6.)
분석 및 학습 (Analytics & Learning). 루프를 닫습니다.

비디오가 성숙할 때까지(~60시간) 기다린 후, 실제 YouTube 수치를 가져와 각 베팅의 바이럴 가능성을 채널 자체의 과거 기록과 비교하여 점수를 매기고, 전략을 다시 작성합니다: 무엇이 성공하고 있는지, 무엇이 실패하고 있는지, 다음에 무엇을 시도해야 하는지를 결정합니다. (Sonnet 4.6.)

관측 가능성 / 운영 (Observability / Ops). 감시자 역할을 합니다. 멈춰 있는 티켓, 렌더링 실패, 링크가 걸리지 않은 게시된 비디오, 예산 이탈 등을 찾아내고 인시던트(incident)를 생성합니다. (Haiku 4.5.)
비서 (Secretary). 매일 Telegram 요약본을 보내주어, 제가 아무것도 열어보지 않고도 회사의 상태를 읽을 수 있게 합니다. (Haiku 4.5.)

모델 계층화(tiering)는 의도적이며 비용에 따른 결정입니다. 판단 자체가 결과물인 경우(작성 및 게이팅)에만 Opus를 사용하고, 모든 조정(coordinational) 작업은 더 저렴한 모델로 처리합니다. 그리고 에이전트들이 종량제 API 호출이 아닌 Claude 구독 기반으로 작동하기 때문에, 추론 (reasoning) 비용은 사실상 무료입니다. 실제로 돈이 드는 유일한 부분은 AI 비디오 생성 그 자체입니다.

하루의 운영 방식

시스템에는 정확히 하나의 타이머만 남아 있습니다: Growth Lead를 깨우는 오전 9시 작업입니다. 그 이후의 모든 것은 이벤트 기반(event-driven)으로 작동합니다. 한 단계를 완료하면 다음 티켓이 다음 에이전트에게 할당 (assign) 되며, 티켓을 할당받는 것이 해당 에이전트를 깨우는 트리거가 됩니다. 댓글은 아무도 깨우지 않습니다. 할당이 에이전트를 깨웁니다.

실제 사례는 다음과 같습니다. 아이디어 단계부터 측정 단계까지, 단일 쇼츠(Short) 영상인 _"Hilbert's Infinite Hotel"_에 대한 실제 티켓들입니다:

[

]

티켓 (Ticket)	실제 작업명 (Real task name)	담당자 (Assignee)
SLO-80	Script: j0034 — Hilbert's Infinite Hotel: The Paradox That Breaks Infinity	QA Critic
...
(담당자는 티켓이 종료되었을 때 해당 티켓을 소유했던 에이전트입니다. "Script" 티켓이 QA에 할당된 상태로 종료되는 이유는, 검증(gate)을 위해 QA에게 전달되었기 때문입니다. 번호가 건너뛰는 이유는 두 개의 형제 쇼츠(Shorts) 영상이 같은 날 아침 사이클을 병렬로 통과했기 때문입니다: SLO-81, 83, 84는 크론(cron)이 같은 날 생성한 _"The Arrow of Time"_에 속합니다.) 6개의 티켓, 6번의 인수인계, 그중 어느 것도 저를 필요로 하지 않았습니다.

무엇을 만들지 결정하는 방식

이 단계는 LLM (Large Language Model)이 추측하는 것이 아닙니다. 탐색(scouting)은 대부분 통계에 기반합니다.

게시된 모든 영상은 측정된 결과가 있는, 반증 가능한 베팅(falsifiable bet)으로 기록됩니다. 분석(Analytics)은 승자와 패자를 명확한 패턴과 아이디어의 씨앗으로 변환합니다. 단순한 톰슨 샘플링 밴딧 (Thompson-sampling bandit)이 학습된 테마 및 포맷 특징 위에 자리 잡고, 각 슬롯마다 이미 알려진 승리 요인을 활용(exploit)할지 아니면 새로운 것을 탐색(explore)할지를 결정합니다. 성장 리드 (Growth Lead)는 밴딧의 선택과 학습된 패턴을 결합하여 실제 베팅을 구체화합니다. 크리에이티브 에이전트 (creative agent)는 마지막 단계에만 개입하며, 느낌(vibes)이 아닌 증거를 바탕으로 작업합니다.

제 채널에 대한 증거가 말해준 것은 다음과 같습니다: 수학과 물리학 분야에서 역설(paradox)을 중심으로 풀어낸 비극적 천재 이야기가 승리한다. 우울함, 공포, 그리고 인구 통계학적 퀴즈 포맷은 패배한다. 시스템은 이것을 제가 아닌, 스스로 측정한 이력을 통해 파악해냈습니다.

내가 제어하는 것 vs 에이전트가 하는 것

이것이 핵심이기에 명확한 선을 긋겠습니다:

내가 제어하는 것 (레버):

예산 제한 (Budget caps): 영상당 및 일일 지출액.
홍보 속도 (Promotion velocity): 하루에 몇 개의 영상을 올릴지, 얼마나 공격적으로 밀어붙일지.
게시 정책 (Publishing policy): 승인형 (내가 각 영상을 승인) vs 비승인형.
콘텐츠 비전 및 가드레일 (Content vision and guardrails): 추구하거나 피해야 할 주제.
브랜딩 (Branding).

에이전트가 스스로 하는 일:

다음 주제 탐색 (bandit + 학습된 패턴).
스크립트 작성 및 재작성.
스크립트 및 최종 편집 단계에서의 품질 검수.
각 영상의 렌더링, 음성 입히기, 게시 및 링크 연결.
실제 성과 측정 및 전략 재수립.
작업이 막힌 것을 감지하고 스스로 협업 조정.

나는 게임의 규칙을 정합니다. 그들은 그 규칙에 따라 플레이합니다.

내가 단 두 번만 개입한 이유

회사를 세우는 것은 일회성 비용이었으며, 그마저도 적은 비용이었습니다. 나는 단 하나의 설정(config) 파일에 모든 것을 선언했습니다: 회사와 그 목표 (교차 수익화, cross monetization), 역할·모델·프롬프트가 지정된 8개의 에이전트, 하나의 크론 루틴 (cron routine) (오전 9시 기상), 그리고 정책 조절 장치들 — 예산 제한 (budget caps), 홍보 속도 (promotion velocity) (하루에 몇 개의 영상을 올릴지, 얼마나 강하게 밀어붙일지), 그리고 게시 여부가 승인형인지 아닌지 말입니다. Paperclip이 그 파일을 읽고, 에이전트들과 목표 트리(goal tree)를 생성하자 조직이 존재하게 되었습니다. 에이전트 하나하나를 돌봐줄 필요도, 수동으로 인수인계를 연결할 필요도 없었습니다. 인수인계는 그저 에이전트들이 서로 주고받는 티켓(ticket)일 뿐입니다.

그 후 지난 일주일의 대부분 동안 나는 다른 업무에 몰두했습니다. 그래서 채널을 운영하는 대신 그대로 내버려 두었습니다.

그 일주일 동안 나는 정확히 두 번만 수동으로 개입했습니다:

콘텐츠 비전(content vision)을 조정했습니다 — 하루 3개의 영상으로 전환하였고, 그중 한 슬롯은 밴딧(bandit) 알고리즘이 단순히 활용(exploiting)만 하는 것이 아니라 항상 탐색(exploring)을 지속할 수 있도록 의도적인 실험적 베팅(experimental bet) 용도로 남겨두었습니다. 저는 이를 정책 작업(policy task)에 대한 코멘트로 남겼고, 성장 리드(Growth Lead)는 이를 베팅을 선택하는 방식에 반영했습니다.
채널 브랜딩을 변경했습니다 — 데이터가 보여주는 승리 공식인 '어둡게 풀어내는 역설(paradoxes, told dark)'에 맞추기 위해, SEO(검색 엔진 최적화)를 고려하여 채널명을 _Starship Pilot_에서 _Paradox Noir_로 변경했습니다.

이것이 전체 목록입니다. 스카우팅(Scouting), 스크립팅(scripting), QA, 렌더링(rendering), 퍼블리싱(publishing), 측정(measurement), 전략 업데이트(strategy updates)까지: 그 어떤 것도 저를 필요로 하지 않았습니다. 저는 운전하기 위해서가 아니라, 읽기 위해 확인했을 뿐입니다.

증빙 자료 (Receipts)

영상	조회수	유지율 (Retention)	구독자	비고
"수십 년 앞서 정리를 증명한 수학자"	523	70%	7	최고 성과 — 상위 100백분위
"살아있으면서 동시에 죽어있는 고양이: 중첩 (Superposition)"	667	23%	3	최다 조회수, 그러나 전환 없는 도달

Insights

Zero to Autopilot, Part 8: 25달러짜리 회사 — 내 채널을 운영하는 AI 에이전트 조직

요약

핵심 포인트