
아무도 만들지 않은 오디오북
요약
전 세계 도서 중 오디오북으로 변환된 비율은 2~5%에 불과하며, 높은 제작 비용이 주요 장벽이었습니다. 하지만 AI 기술의 발전으로 비용 장벽이 무너지면서 미개척된 오디오북 시장의 잠재력이 커지고 있습니다.
핵심 포인트
- 전 세계 도서의 95% 이상이 아직 오디오북으로 존재하지 않음
- 기존 오디오북 제작은 높은 성우 고용 비용과 긴 작업 시간 소요
- AI 기술 도입으로 인한 제작 비용 절감 및 시장 확장 가능성
대부분의 책은 여전히 어떤 언어로도 오디오 형태로 존재하지 않습니다. 그동안 이 책들을 침묵하게 만들었던 것은 비용이었으며, 이제 그 비용 장벽은 무너졌습니다. 하지만 그 공백을 메우기 위해 쏟아져 들어오는 대부분의 오디오는 저질 콘텐츠 (slop)입니다.
프랑스에는 약 750,000권의 인쇄된 책이 있습니다. 그중 약 20,000권만이 오디오북으로 존재합니다. 이는 Spotify의 자체 수치이며, 3% 미만입니다. 나머지 730,000권의 프랑스 서적은 오디오 판본이 전혀 없습니다.
프랑스만이 예외는 아닙니다. Audible의 CEO인 Bob Carrigan은 2025년에 이를 명확히 밝혔습니다: 전 세계 책 중 단 2~5%만이 오디오로 변환되었습니다. 우리는 마치 서가가 가득 차 있고 다음에는 무엇을 살지만 고민하면 되는 것처럼 오디오북 붐에 대해 이야기합니다. 하지만 서가는 거의 비어 있습니다. 제작되는 수천 개의 타이틀이 여러분에게 마케팅되는 것들이기에 서가가 가득 찬 것처럼 보일 뿐입니다.

30권 중 단 1권만이 오디오로 존재합니다. 나머지는 어떤 언어로도 존재하지 않습니다.
15년 동안 이 현상에는 명확한 이유가 있었으며, 그 이유는 바로 돈이었습니다.
서가가 비어 있었던 이유
전문 성우를 고용하는 비용은 완성된 오디오 1시간당 약 250달러이며, 이는 ACX의 SAG-AFTRA 노조 최저 기준이자 하한선일 뿐, 상한선이 아닙니다. 일반적인 소설은 완성된 분량 기준으로 8시간에서 11시간 정도이며, 대략적인 6:1 법칙에 따라 완성된 1시간을 만들기 위해 녹음, 편집, 교정 및 마스터링(Mastering)에 약 6시간의 작업이 소요됩니다. 따라서 영어 오디오북 한 권을 제작하는 데는 2,000달러에서 5,000달러 사이의 비용이 들고, 스튜디오 작업 시간은 4주에서 8주가 걸립니다. 실제로는 몇 달이 걸리기도 하는데, 우선 고용할 만한 가치가 있는 성우의 스케줄이 비기를 기다려야 하기 때문입니다.
이제 이 과정을 독일어로 다시 해보십시오. 그다음 스페인어, 그다음 일본어로 말입니다. 각 언어마다 비용을 두 번 지불해야 했습니다. 한 번은 책을 번역하기 위해, 또 한 번은 원어민의 목소리로 다시 낭독하기 위해 말입니다. 비용은 단순히 더해지는 것이 아니라 배수로 늘어났습니다. 그래서 출판사들은 가끔 영어 오디오북을 만들고는 그만두었습니다. 당신의 소설이 독일어 인쇄본으로는 팔리고 있을 때, 오디오 판권은 방치되어 있었습니다. 엑셀 시트의 계산이 맞지 않았기 때문입니다.

각 언어마다 번역과 재낭독이라는 전체 비용을 다시 지불해야 했습니다.
저렴한 대안이 등장했지만, 대부분은 쓰레기였다
그 후 무료 도구들이 등장했습니다. Google Play Books는 비용 부담 없이 원고를 자동으로 낭독(Auto-narrate)해주며, 해당 파일을 다른 곳에서도 판매할 수 있게 해줍니다. Apple Books도 영어에 한해 동일한 기능을 제공하며, Apple이 낭독한 버전은 Apple Books를 통해 배포됩니다. Audible의 Virtual Voice는 Kindle 내부에서 이 기능을 수행합니다. 갑자기 누구나 비용 한 푼 들지 않고 오디오북을 만들 수 있게 되었습니다.
문제는 '무료'로 만들어지는 결과물이 무엇인가 하는 점입니다. 이러한 도구들은 파일에 있는 원문 텍스트를 그대로 음성 합성 (Text-to-Speech, TTS) 합니다. 아무도 원고를 먼저 준비하지 않기 때문에, 각주, 제목, 약어 등이 적힌 그대로 낭독됩니다. 편집 과정도, 수정 과정도 없습니다. 목소리는 명확하지만 단조롭습니다. 단어를 읽을 뿐, 연기하지는 않습니다. 그리고 가장 저렴한 옵션들은 인세의 일부를 가져가거나 파일을 특정 스토어에 종속시킵니다.
그 결과는 범람이었습니다. 품질보다는 속도, 명확성보다는 리듬, 맥락에 대한 감각보다는 극적인 과장만을 위해 구축된 시스템에 의해 생성된 수만 권의 성급한 오디오북들이 쏟아져 나왔습니다. 작가들도 이를 알아차렸습니다. 공급이 늘어남에 따라 AI 내레이션을 사용하려는 의지는 높아지기는커녕 오히려 떨어졌습니다. 2023년 77%에서 2025년에는 70%로 감소했으며, AI 타이틀의 매출 비중은 여전히 1% 미만입니다. 기술이 우물을 오염시킨 것이 아닙니다. 기술을 부주의하게 사용한 것이 우물을 오염시켰습니다.

AI 내레이션을 사용하려는 작가의 의지는 상승하는 것이 아니라 하락하고 있습니다. 점선은 측정된 값이 아닌 예측치입니다.
제대로 하는 법
그 격차가 바로 제가 TomeVox를 만든 이유이며, 해결책은 생소한 것이 아닙니다. 그것은 무료 도구들이 건너뛰는 단계들입니다.
성능부터 시작하십시오. TomeVox는 단순히 명확함만을 위해서가 아니라 극적인 효과를 위해 내레이션합니다. 대화는 대화답게 읽고, 인용구나 1인칭 구절에 맞춰 변화를 주며, 모든 문장을 하나의 음조로 평탄하게 만드는 대신 사람이 하는 것처럼 장면의 속도를 조절합니다. 이것이 당신의 단어를 읽는 목소리와 단어를 연기하는 목소리의 차이이며, 이것이 TomeVox가 비즈니스 서적뿐만 아니라 소설에서도 작동하는 이유입니다.
그다음은 준비 단계입니다. 모든 원고는 단 한 단어가 낭독되기 전에 준비 단계를 거칩니다. 따라서 구조, 약어, 이름 등을 사전에 처리하여, 낭독이 마크업 (markup)이 아닌 책 자체를 읽어 내려가도록 합니다. 발음도 그 일부입니다. 대부분의 AI는 이름, 지명, 그리고 여러 가지 올바른 읽기 방식이 있는 단어들을 망가뜨리곤 합니다. 우리의 프로세스는 이를 방지하기 위해 특별히 구축되었으며, 검토 단계 (review pass)를 통해 누락된 부분을 잡아내고, 저희가 놓친 부분은 무엇이든 수정을 요청할 수 있습니다. 마지막에 검토와 수정 과정이 존재하므로, 한 번 내보내면 끝인 일회성 수출 (one-shot export) 방식이 아닙니다. 첫 장은 무료로 제공되므로, 나머지 비용을 지불하기 전에 당신의 책에 적용된 목소리를 직접 들어볼 수 있습니다.
그리고 이것은 단순히 몇 가지 기능이 추가된 영어가 아닙니다. TomeVox는 200개 이상의 목소리로 13개 언어를 낭독하며, 중요한 부분에서는 실제 지역적 범위 (regional range)를 제공합니다. 현대 표준 아랍어부터 이집트, 걸프, 레반트 지역까지 8가지 아랍어 변체, 카스티야에서 멕시코, 카리브해까지 5가지 스페인어 악센트, 그리고 중국어를 위한 만다린 (Mandarin), 광둥어 (Cantonese), 복건어 (Hokkien)가 포함됩니다. 카이로의 독자와 멕시코시티의 독자에게 똑같은 일반적인 목소리가 전달되지 않습니다.
당신이 최종적으로 얻게 되는 것은 당신이 소유하는 파일입니다. 책당 고정 비용, 챕터 마커가 포함된 M4B 및 MP3, 완전한 상업적 권리 (commercial rights), 로열티 배분 없음, 그리고 스토어 종속 (store lock-in) 없음이 보장됩니다. EU AI 법 (EU AI Act)의 제50조 투명성 의무는 2026년 8월 2일부터 적용되며, 위반 시 최대 1,500만 유로의 벌금이 부과될 수 있습니다. TomeVox는 투명하게 정보를 공개하므로 당신은 법규를 준수할 수 있습니다.
이것이 당신에게 남기는 것
대부분의 책은 여전히 어떤 언어로도 오디오북이 없으며, 그동안 오디오북이 없었던 유일한 이유가 마침내 사라졌습니다. 그 기회를 잡는 방법은 당신의 단어를 단조롭게 읽고 파일을 가두어 버리는 가장 빠르고 저렴한 도구를 사용하는 것이 아닙니다. 하나의 좋은 오디오북을 만든 다음, 그것을 당신의 독자들이 실제로 사용하는 언어로 존재하게 만드는 것입니다.
그 부분은 당신의 책을 번역하고 외국어 오디오북을 만드는 방법에서 상세히 작성하였습니다. tomevox.com에서 당신의 첫 번째 장을 무료로 직접 들어보며 그 차이를 느껴보세요.
아무도 만들지 않은 오디오북은 수학 문제와 같았습니다. 수학 공식이 바뀌었습니다. 선반은 여전히 비어 있습니다. 가서 당신의 책을 그곳에 올려두세요.
Daniel Shilansky는 당신의 원고로부터 13개 언어로 스튜디오 품질의 오디오북을 제작하는 TomeVox의 설립자입니다. 이 글은 원래 tomevox.com에 게시되었습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기