본문으로 건너뛰기

© 2026 Molayo

Reddit요약2026. 05. 17. 08:03

GitHub - richardr1126/openreader: 고품질 TTS 옵션, 동기화된 하이라이팅, 그리고 EPUB, PDF, DOCX

요약

OpenReader v3.0.0은 EPUB, PDF, TXT, Markdown, DOCX 등 다양한 형식의 문서를 읽고 오디오북으로 내보낼 수 있는 오픈 소스 TTS 문서 리더 웹 애플리케이션입니다. 주요 업데이트로는 미리 로딩 기능이 추가되어 사용자 경험을 개선했으며, 관리자 패널을 통해 여러 TTS 제공업체와 사이트 기능을 런타임에 쉽게 관리할 수 있게 되었습니다. 또한, 자체 호스팅 환경에서 모든 데이터(문서, 오디오, 설정)를 SQLite/Postgres 및 SeaweedFS/S3를 이용해 안전하게 저장하고, ffmpeg를 사용해 m4b/mp3 형식의 오디오북을 생성하는 기능을 제공합니다.

핵심 포인트

  • 다양한 문서 포맷 (EPUB, PDF, DOCX 등)을 지원하며 TTS로 읽어주는 웹 앱입니다.
  • OpenAI, Replicate 등 여러 외부 TTS 제공업체와 자체 호스팅 API를 모두 지원합니다.
  • v3.0.0에서는 오디오 미리 로딩 기능과 관리자 패널이 추가되어 사용 편의성과 운영 유연성이 크게 향상되었습니다.
  • 모든 데이터를 자체 서버에 저장하고, 챕터 메타데이터가 포함된 m4b/mp3 형식의 오디오북을 생성할 수 있습니다.

저의 최신 릴리스인 OpenReader v3.0.0을 공유합니다. 이는 오픈 소스 텍스트 음성 변환 (Text-to-Speech, TTS) 문서 리더이자 오디오북 내보내기 도구입니다. 출시된 지 1년이 넘었으며, 천천히 300개 이상의 GitHub stars를 획득했습니다.

OpenReader란 무엇인가요?
EPUB, PDF, TXT, Markdown, 그리고 DOCX 파일을 읽고 들을 수 있는 Next.js 웹 앱입니다.

  • 다양한 TTS 제공업체를 지원합니다: OpenAI, Replicate, Deepinfra, 그리고 자체 호스팅되는 OpenAI 호환 API (예: Kokoro-FastAPI, KittenTTS-FastAPI).
  • 자체 호스팅 (Self-hosted): 귀하의 문서, TTS 오디오, 설정은 모두 SQLite 또는 Postgres, 그리고 Embedded SeaweedFS 또는 External S3를 통해 귀하의 자체 서버에 저장됩니다.
  • 오디오북 내보내기: ffmpeg를 통해 챕터 메타데이터가 포함된 m4b/mp3 오디오북을 생성하고 다운로드할 수 있습니다.

v3.0.0의 새로운 기능은 무엇인가요?

  • 이제 TTS가 현재 위치보다 여러 페이지 앞서 오디오를 미리 로드합니다.
    • 오디오는 서버의 임베디드 또는 외부 객체 스토리지 (Object Storage)에 지속적으로 캐싱됩니다.
  • 새로운 관리자 패널 (환경 변수에 ADMIN_EMAILS 설정)이 추가되어, 별도의 API 키를 가진 여러 이름의 TTS 제공업체를 관리할 수 있습니다.
    • 사이트 전체 기능 플래그 (사용자 가입, 제공업체 제한 등)를 이제 재배포 없이 런타임 (Runtime) 중에 관리자 패널에서 관리할 수 있습니다.

시작하기:
https://github.com/richardr1126/openreader

Docker 빠른 시작: https://docs.openreader.richardr.dev

여러분의 피드백, 기능 요청, 또는 기여를 환영합니다!

AI 자동 생성 콘텐츠

본 콘텐츠는 Reddit AI Engineering의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0