
OpenReader: 함께 읽기 기능이 있는 문서 TTS를 위한 Speechify 및 ElevenLabs의 대안
요약
OpenReader v4.1.2는 EPUB, PDF 등 다양한 문서를 읽어주는 오픈 소스 TTS 문서 리더입니다. OpenAI 및 자체 호스팅 API를 지원하며, 단어 단위 하이라이팅과 오디오북 내보내기 기능을 제공합니다.
핵심 포인트
- OpenAI, Replicate 등 다양한 TTS API 지원
- 단어 단위 동기화 하이라이팅 기능 제공
- SQLite/Postgres 및 S3를 통한 자체 호스팅 가능
- ffmpeg를 활용한 m4b/mp3 오디오북 생성 지원
- v4.2.0에서 다국어 지원 및 예약 작업 관리 기능 추가
오픈 소스 텍텍스트 음성 변환 (TTS) 문서 리더이자 오디오북 내보내기 도구인 OpenReader v4.1.2의 최신 출시 소식을 공유합니다. 이 프로젝트는 출시된 지 1년이 넘었으며, 서서히 300개 이상의 GitHub 스타를 획득했습니다. OpenReader란 무엇인가요? EPUB, PDF, TXT, MD, DOCX 파일을 읽고 들을 수 있는 Next.js 웹 앱/서버로, 내레이션 시 함께 읽기 하이라이팅 (read-along highlighting) 기능을 제공합니다. 다양한 TTS 제공업체: OpenAI, Replicate, Deepinfra, 그리고 자체 호스팅 가능한 OpenAI 호환 API (Kokoro-FastAPI, KittenTTS-FastAPI, Orpheus-FastAPI 등)를 지원합니다. 자체 호스팅 (Self-hosted): 사용자의 문서, TTS 오디오, 설정은 모두 SQLite 또는 Postgres, 그리고 Embedded SeaweedFS 또는 External S3를 통해 사용자의 자체 서버에 저장됩니다. 단어를 따라가는 함께 읽기: 모든 곳에서 문장 단위 하이라이팅을 지원하며, 동기화된 오디오에서 실제 단어 단위 하이라이팅을 제공합니다. 이는 whisper ONNX PP-DocLayout-V3에 의해 구동됩니다. 파싱 (Parsing): PDF는 CPU 효율적인 ONNX 모델로 파싱되어 하이라이팅이 페이지의 실제 텍스트와 일치하며, 원치 않는 콘텐츠는 건너뜁니다. 오디오북 내보내기: ffmpeg를 통해 챕터 메타데이터가 포함된 m4b/mp3 오디오북을 생성하고 다운로드할 수 있습니다. 시작하기: https://github.com/richardr1126/openreader Docker 빠른 시작: https://docs.openreader.richardr.dev 여러분의 피드백, 기능 요청 또는 기여를 환영합니다! 수정 사항: 다국어 지원 및 관리자를 위한 예약 작업 관리자 (scheduled task manager) 기능이 포함된 v4.2.0이 현재 출시되었습니다!
AI 자동 생성 콘텐츠
본 콘텐츠는 r/SelfHosted (AI filter)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기