본문으로 건너뛰기

© 2026 Molayo

X요약2026. 05. 28. 11:25

OmniVoice Studio: API 키 없이 로컬에서 실행되는 실시간 받아쓰기, Zero-shot 음성 복제 및 비디오 더빙용 오픈 소스

요약

OmniVoice Studio는 API 키 없이 로컬에서 실행되는 오픈 소스 데스크톱 앱입니다. 실시간 받아쓰기, 3초 분량의 클립을 활용한 Zero-shot 음성 복제, 비디오 더빙 기능을 제공합니다.

핵심 포인트

  • API 키 없이 로컬 환경에서 완전 실행 가능
  • 646개 언어 지원 및 3초 음성 샘플로 복제 가능
  • 성별, 연령, 감정 등 음성 속성 미세 조정 지원
  • YouTube 및 로컬 파일 대상 비디오 더빙 기능 제공
  • macOS, Windows, Linux 멀티 플랫폼 지원

OmniVoice Studio는 API 키 없이 완전히 로컬에서 실행되는 실시간 받아쓰기 (Dictation), Zero-shot 음성 복제 (Voice Cloning), 그리고 비디오 더빙 (Video Dubbing)을 위한 오픈 소스 (Open-source) 데스크톱 앱입니다.

  • 646개 언어에 걸쳐 3초 분량의 클립만으로 어떤 음성이든 복제
  • 성별, 연령, 억양, 피치 (Pitch), 감정과 같은 음성 속성 미세 조정 (Fine-tune)
  • YouTube URL 또는 로컬 파일을 통한 번역 및 재음성화를 포함한 비디오 더빙
  • macOS, Windows, Linux용 데스크톱 앱으로 사용 가능

여기에서 확인해 보세요:
https://opensourceprojects.dev/post/omnivoice-studio

AI 자동 생성 콘텐츠

본 콘텐츠는 X @githubprojects (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0