본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 21. 19:44

이제 ElevenLabs나 Wisprflow에 비용을 지불할 필요가 없습니다. 누군가 이 두 가지를 하나의 앱으로 오픈 소스화했습니다.

요약

ElevenLabs와 Wisprflow를 대체할 수 있는 오픈 소스 로컬 앱 Voicebox를 소개합니다. 목소리 복제, TTS, 글로벌 받아쓰기 기능을 제공하며 MCP 서버를 통해 AI 에이전트와 연동할 수 있습니다.

핵심 포인트

  • ElevenLabs/Wisprflow를 대체하는 완전 무료 오픈 소스 앱
  • 로컬 실행으로 API 키 불필요 및 데이터 보안 강화
  • 7개 TTS 엔진과 23개 언어 지원 및 목소리 복제 기능
  • MCP 서버 지원으로 Claude Code, Cursor 등과 연동 가능
  • 시스템 전역 단축키를 통한 실시간 받아쓰기 지원

이제 ElevenLabs나 Wisprflow에 비용을 지불할 필요가 없습니다. 누군가 이 두 가지를 하나의 앱으로 오픈 소스화(Open-sourced)했습니다.

완전 무료입니다. 로컬(Locally)에서 실행됩니다. API 키가 필요 없습니다. 사용량 제한도 없습니다. 오디오가 기기를 벗어나지 않습니다.

어떤 목소리든 복제(Clone)할 수 있습니다. 글로벌 받아쓰기(Dictation) 단축키를 지원합니다. 당신의 AI 에이전트가 이를 통해 대답할 수 있습니다. 7개의 TTS 엔진과 23개의 언어를 지원합니다.

5분 안에 완료하는 전체 설정 방법은 다음과 같습니다:

  1. 다운로드 + 설치
    Mac (Apple Silicon, Intel) 또는 Windows용을 다운로드하거나, Docker를 통해 실행하세요. 앱을 열고 Applications 폴더로 드래그한 뒤 실행합니다.

  2. 목소리 복제 (60초)
    Profiles 탭 → new profile → 10~30초 분량의 깨끗한 오디오 샘플을 업로드하세요. 이제 그것이 당신의 목소리가 되며, 모든 엔진에서 재사용할 수 있습니다.

  3. 음성 생성
    프로필을 선택하고, 텍스트를 입력한 뒤, 생성(Generate)을 누르세요. 처음 실행할 때 모델을 한 번 다운로드하며, 그 이후에는 클립당 몇 초밖에 걸리지 않습니다.
    Chatterbox Turbo를 사용하고 /를 입력하여 [laugh] [sigh] [gasp] 태그를 삽입할 수 있습니다.

  4. AI 에이전트에게 당신의 목소리 부여하기
    Voicebox에는 MCP 서버가 포함되어 있습니다. Claude Code, Cursor 또는 Cline에 한 번만 추가하면, 당신의 에이전트가 voicebox.speak를 호출하여 복제된 당신의 목소리로 대답할 수 있습니다.

  5. 무엇이든 받아쓰기
    글로벌 단축키를 설정하세요. 시스템 어디에서든 단축키를 누른 상태로 말하고 떼면 됩니다. 전사된 텍스트(Transcript)가 Slack, 이메일, 코드, 브라우저 등 현재 포커스가 맞춰진 필드에 붙여넣기 됩니다.

당신은 단 200MB 크기의 네이티브 앱으로 두 개의 SaaS 구독을 대체했습니다.

[IMG:1]
[IMG:2]

AI 자동 생성 콘텐츠

본 콘텐츠는 X @cyrilxbt (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0