AI와 함께하는 150단어 속의 삶
요약
LLM을 활용하여 저명한 여성들의 짧은 전기를 60초 분량의 릴스 영상으로 제작하는 워크플로우를 소개합니다. Claude Sonnet 4.6의 페르소나 기술과 Remotion을 결합하여 사실에 기반한 매력적인 서사 구조를 구축하는 과정을 다룹니다.
핵심 포인트
- LLM의 과장된 표현과 일반화 경향을 극복하기 위한 프롬프트 엔지니어링의 중요성
- Claude Sonnet 4.6이 Opus 4.7보다 사실 중심의 짧은 서사 작성에 더 적합함을 발견
- 시나리오 작가 페르소나를 통해 후크, 전환, 보상의 서사 구조(Arc) 구현
- Remotion과 지식 베이스를 결합한 자동화된 영상 제작 인프라 구축
한 여성의 삶을 60초짜리 릴스(reel)로 만드는 과정에 포함된 모든 일들 중에서, 글쓰기는 쉬운 부분일 것이라고 생각했습니다. 150단어 안에 좋은 이야기를 들려주는 것은 분명 대규모 언어 모델 (Large Language Model, LLM)이 잘해야 하는 일일 것입니다. 하지만 이는 놀라울 정도로 어렵다는 것이 증명되었습니다. 초안을 거듭할수록 일반적인 AI의 약점들이 나타났습니다. 즉, 과장된 표현과 영감을 주는 언어를 사용하는 경향, 일반화하는 경향, 전형적인 창업자 서사("지하실에서 구축됨")를 따르는 경향, 그리고 병적인 세부 사항에 집중하는 경향이었습니다. (이 작업에서 저는 Sonnet 4.6을 사용했는데, 긴 바이오그래피 (biography)를 작성하는 데 있어 Opus 4.7보다 더 현실적이고, 사실에 충실하며, 덜 창의적이라는 점에서 더 낫다는 것을 발견했습니다.) 출판 가능한 수준에 도달하기까지 상당한 양의 작업이 필요했습니다. 그렇긴 하지만, 이 이야기 속의 인간 또한 좋은 단편 서사 구조를 쓰는 것이 놀라울 정도로 어렵다는 것을 깨달았기에, 시스템이 이를 적절히 수행하도록 하는 데 들인 노력은 충분한 가치가 있었습니다. 먼저 배경을 설명한 뒤, 제가 무엇을 했는지 말씀드리겠습니다.
저는 Tycoona라는 웹사이트에서 한동안 저명한 여성들의 짧은 전기 (biography)를 게시해 왔습니다. 왜 저명한 여성들일까요? 각 분야에는 엄청난 기여를 했음에도 잘 알려지지 않은 여성들이 아주 많기 때문입니다. 팝 아티스트 수녀였던 Corita Kent가 왜 Andy Warhol만큼 유명하지 않은지, 도금 시대 (Gilded Age)의 가치 투자자로서 "월스트리트의 마녀"이자 "월스트리트의 여왕"이라 불렸던 Hetty Green이 왜 Benjamin Graham과 그의 제자 Warren Buffett 뒤로 사라져 역사 속으로 숨어버렸는지 저는 이해할 수 없었습니다. 제가 직면한 문제는 아무도 제 전기 (biographies)를 보지 않는다는 것이었고, 그래서 도달 범위를 넓히기 위해 짧은 영상이나 릴스 (reels)를 만들기로 결정했습니다.
기존 시스템 위에 릴스 (reels)를 위한 기술적 인프라를 구축하는 것은 즐겁고 비교적 간단했습니다. 각 릴스는 일련의 "비트 (beats)"로 구성되며, Remotion은 이러한 비트들을 화면상의 텍스트, 그리고 Wikimedia, Flickr 또는 Library of Congress에서 가져온 저작권 프리 이미지 및 출처와 함께 세로형 릴스로 변환합니다. 콘텐츠의 경우, 비트 생성기는 제 시스템이 각 인물에 대해 생성하는 검증된 사실들의 지식 베이스(knowledge base)에 의존합니다: 인용구, 타임라인, 업적, 관계, 유산, 추가 사실, 그리고 "논쟁의 여지가 있는 항목 (contested items)" 등이 포함됩니다. 아크 라이터 (arc writer)가 (더 잘) 작동하도록 하기 위해 제가 수행한 3가지 이상의 작업은 다음과 같습니다.
시나리오 작가 페르소나/기술 (Screenwriter Persona/Skill)
첫째로, 저는 전역 Claude 기술 (global Claude skill)인 시나리오 작가 페르소나를 만들었습니다. 시나리오 작가는 사실에 기반하여 시청자가 시간의 흐름 속에서 자신이 어디에 있는지 항상 알 수 있도록, 짧은 영상을 위한 매력적인 이야기를 쓰는 데 특화되어 있습니다. 시나리오 작가는 각 릴스가 단순히 업적을 나열하는 것이 아니라, 하나의 아크 (arc, 즉 후크(hook), 전환(turn), 보상(payoff))가 필요하다는 점을 알고 있습니다. 제 프로젝트의 "컨텍스트 (context)" 파일은 전역 시나리오 작가 기술에게 프로젝트의 아크 생성 프롬프트가 어디에 있는지, 어떤 데이터베이스 필드에 인용해야 할 검증된 사실들이 들어 있는지, 그리고 도움을 받을 수 있는 다른 기술/페르소나에는 무엇이 있는지를 알려줍니다.
저는 시나리오 작가에게 비트 생성 프롬프트를 다시 작성하게 했고, 그 후 제가 직접 편집하여 UI에 노출했습니다. 이 과정에서 저의 "수석 설계자 (chief architect)" 기술은 비트 생성기가 두 개의 서로 다른 곳으로부터 모순된 지침을 받고 있다는 점을 포착했습니다. 우리는 이를 하나의 기존 voice.md 파일로 합리화하여 정리하였으며, 이 파일에는 다음과 같은 핵심 원칙이 포함되어 있습니다: 사실이 스스로 말하게 할 것, 과장과 일반화를 피할 것, 전기적 찬양 (hagiography)보다는 역학 (mechanics)을 선택할 것, 병적인 면 (morbidity)보다는 중요성 (significance)을 선택할 것. 또한 우리는 사실성 (factuality) 프롬프트를 개선했습니다: 각 비트가 검증된 사실을 포함해야 할 뿐만 아니라, 비트 전체가 사실적이어야 합니다.
이러한 변화들은 확실히 도움이 되었습니다. 단순한 사실의 나열이 아닌, 하나의 이야기를 얻을 수 있었습니다. 예를 들어, voice.md 파일에 지속적으로 접근한 덕분에 모델의 병적인 성향(morbid tendencies)을 일부 제거할 수 있었습니다. 예를 들어, 마리 퀴리(Marie Curie)가 납 상자에 안치되어 있으며, 방사능 때문에 그녀의 실험 노트는 1500년 동안 납 상자에 보관되어야 한다고 굳이 언급하려는 고집 같은 것 말입니다. 마지막으로, "사실(fact)" 프롬프트는 모델이 문서화되지 않은 사실로부터 무언가를 추론하는 것을 방지했습니다.
이러한 진전에도 불구하고, 스토리 아크(story arcs)는 활력이 부족했습니다. 아크 생성기(arc generator)는 LLM의 많은 "나쁜 습관"을 그대로 유지하고 있었습니다. 즉, 일반적인 서사에 의존하고, 모호한 언어를 사용하며, 매력적인 세부 사항을 생략하는 경향이었습니다.
명시적 스토리 아크 (Explicit Story Arc)
다양한 초안을 반복하며(iterating), 하나의 삶에는 수많은 가능한 아크가 있을 뿐만 아니라, 선택된 아크를 표면화하는 것이 시스템이 더 나은 이야기를 생성하는 데 도움이 된다는 점이 분명해졌습니다.
좋은 예로 과학자 로잘린드 프랭클린(Rosalind Franklin)을 들 수 있습니다. 대중적인 서사에서 그녀는 왓슨(Watson)과 크릭(Crick)에게 노벨상을 가로채인 인물로 묘사됩니다. 게다가, 이러한 대중적인 원망의 서사는 100% 사실이 아닙니다. 프랭클린의 연구와 왓슨 및 크릭의 연구는 동일한 연구 기관의 자금 지원을 받았으며, 데이터 공유는 미국인들보다 먼저 성과를 내기 위한 정당한 추구 과정에서 일어났을 수도 있습니다. 이 캐릭터에 대해서는 꽤 다양한 아크가 가능합니다:
"자신의 동의 없이 DNA의 '사진 51(Photo 51)'이 경쟁자들에게 공유된 과학자."
"두 번의 노벨상을 받은 네 명의 남성 뒤에 있었던 여성."
"분자 구조를 밝혀냄으로써 37세가 되기 전 재료 과학, 생물학, 바이러스학 분야에 지대한 공헌을 한 X선 결정학(X-ray crystallography) 전문가."
저는 불만 섞인 서사를 쓰는 것에는 관심이 없으며, 이 여성들이 무엇을 어떻게 해냈는지 진정으로 이해하는 데 더 관심이 있습니다. 따라서 제가 원하는 이야기를 얻기 위해, 시스템 내에서 스토리 아크 (story arc)를 명시적으로 설정하고 비트 생성기 (beat generator)가 주어진 아크를 바탕으로 작동하도록 만들었습니다. 시간을 절약하기 위해 시스템이 제가 선택할 수 있는 다섯 가지의 서로 다른 아크를 생성할 수 있도록 만들었지만, 일반적으로는 제가 직접 작성합니다.
아크에 사실 관계 추가하기
모든 삶에는 흥미로운 이야기를 만들어내는 예상치 못한, 그리고 잘 알려지지 않은 세부 사항들이 있습니다. NASA의 천재적인 수학자 Katherine Johnson은 대학원을 졸업하고 NACA(이후 NASA)에서 일을 시작하기 전까지 3명의 딸을 키우며 13년 동안 경력 단절 "공백 (gap)"을 가졌습니다. 그리고 그녀의 복직은 첫 남편의 암 진단으로 인해 촉발된 것으로 보입니다. 의료 기록 거대 기업인 Epic Systems의 창립자 Judy Faulkner는 1965년 UW-Madison에서 새로 만들어진 컴퓨터 과학 (Computer Science) 분야의 대학원 과정을 밟은 최초의 여성 중 한 명이었습니다. 그리고 그녀의 유명할 정도로 철저히 비공개인 회사의 계율은 다음과 같이 시작됩니다: "상장하지 마라. 인수하거나 인수되지 마라. 소프트웨어는 반드시 작동해야 한다."
모든 좋은 이야기에는 독자가 붙잡을 수 있는 세부 사항이 필요하지만, 모델은 좋은 것을 골라내는 데 능숙하지 않습니다. 어쨌든, 제 시스템에서 더 매력적인 아크를 끌어내는 비결은 아크에 사실 관계를 추가하는 것이었습니다. 이러한 스캐폴딩 (scaffolding)을 통해, 시스템은 릴스 (reels)를 위한 간결하고 일관되며 때로는 매력적인 스토리 아크를 생성할 수 있습니다.
일부 내용을 제외해야 하는 상황
이야기에 몰입한 인간에게 고통스러운 부분은 무엇을 제외해야 하는가입니다. Stephanie Shirley는 잘 알려지지 않은 영국의 컴퓨터 프로그래머로, 직장에서 성희롱과 유리 천장 (glass ceilings)을 경험한 후, 유연한 근무 시간과 재택근무가 필요한 여성 간병인들을 고용하여 1962년에 소프트웨어 엔지니어링 회사를 설립했습니다. 회사가 성장함에 따라 그녀는 직원들에게 경영권을 양도했고, 이후 회사를 거의 5억 달러에 매각하여 그 재산을 자선 단체에 기부했습니다. 공교롭게도 그녀는 1939년 5세의 나이에 아홉 살 난 여동생과 함께 킨더트랜스포트 (Kindertransport)를 통해 독일에서 영국으로 건너왔습니다. 그녀는 자신의 평생의 동기를 단 한 줄로 표현했습니다. "내 삶이 구원받을 가치가 있었기를 바랐다." 하지만 이 모든 서사(narratives)는 150단어의 아크 (arc) 안에 담길 수 없습니다. 어떤 것들은 제외되어야 하며, 그것은 슬픈 일입니다. 그리고 어떤 것들은 1,000단어 분량의 전기 (biography)에도 담기지 못할 수도 있습니다.
시사점 (The Takeaway)
LLM (대규모 언어 모델)은 콘텐츠를 빠르게 생성할 수 있지만, 반드시 잘 생성하는 것은 아닙니다. LLM의 성능은 컨텍스트 (context)에 달려 있습니다. 이 경우에는 지식 베이스 (knowledge base), 이를 사용하는 방법에 대한 구체적인 지침, 일련의 스타일 가이드라인, 명확하게 표현된 스토리 아크 (story arc), 그리고 그 아크를 뒷받침하는 선택된 세부 사항들이 이에 해당합니다. 이러한 컨텍스트를 제대로 설정한다면, LLM은 출판할 가치가 있는 무언가를 만드는 데 도움을 줄 수 있습니다. 솔직히 말해 인간의 입력에 크게 의존하지만 의심할 여지 없이 수백 시간의 지루한 시간을 아껴주는 저의 릴스 생성기 (reel generator) 덕분에, Instagram, TikTok, 그리고 YouTube 전반에 걸쳐 25만 명 이상의 사람들이 더 잘 알려질 자격이 있는 여성들인 Corita Kent, Katherine Johnson, Hetty Green, Rosalind Franklin, 그리고 (곧) Stephanie Shirley에 대해 알게 되었습니다. AI가 힘든 작업 (heavy lifting)의 일부를 수행하지만, 현재로서는 인간이 읽고 싶어 하는 이야기를 쓰기 위해서는 여전히 인간이 필요합니다.
Tags: ai, machinelearning, opensource, productivity
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기