본문으로 건너뛰기

© 2026 Molayo

Deep Tech요약2026. 06. 03. 07:43

누구의 목소리든 3초 만에 무료로 복제합니다!

요약

3초 만에 목소리를 복제할 수 있는 오픈 소스 로컬 음성 변환 도구를 소개합니다. 646개 언어를 지원하며 YouTube 링크만으로 전사, 번역, 음성 변환을 자동 수행합니다.

핵심 포인트

  • 완전 로컬 작동 및 오픈 소스로 비용 절감
  • 646개 언어 지원 및 다양한 음성 커스텀 가능
  • Demucs와 Pyannote를 활용한 고성능 오디오 처리
  • Claude 및 Cursor 연동을 위한 MCP 내장

🚨 누구의 목소리든 3초 만에 복제하며 무료입니다! 🫪

이미 3,600개의 별(Stars)을 받았으며, 완전히 로컬(Local)에서 작동합니다 ⬇️

다른 곳에서는 한 달에 1,320달러가 드는 기능이 이제 오픈 소스(Open Source)가 되었습니다.

→ 646개 언어 지원, ElevenLabs는 단 32개 언어만 지원합니다.

→ 목소리 커스텀: 성별, 연령, 악센트(Accent), 톤(Tone), 감정, 방언(Dialect)

→ YouTube 링크만 추가하면 됩니다.

자동 전사(Transcription) → 번역(Translation) → 음성 변환(Voice Conversion) → MP4 출력

→ 글로벌 받아쓰기: 어떤 소프트웨어에서든 ⌘ + ⇧ + Space 키를 누르고 말하세요.

→ Demucs는 배경 음악을 유지하면서 보컬을 분리합니다.

→ Pyannote는 어떤 문장을 누가 말했는지 자동으로 라벨링(Labeling)합니다.

→ 배치 처리(Batch Processing) 대기열: 50개의 비디오를 추가하면 처리가 완료됩니다.

→ 내장된 MCP는 Claude 및 Cursor에서 직접 설정할 수 있습니다.

→ 내장된 Meta AudioSeal 워터마크

링크 🔗 👇

AI 자동 생성 콘텐츠

본 콘텐츠는 X @DeepTechTR (AI/오픈소스)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0