무료로 이 정도를 할 수 있는 도구. GitHub에서 벌써 스타 1만 개 돌파.
요약
Voice-Pro라는 도구가 공개되어, YouTube 영상 전체를 다국어로 더빙하는 기능을 무료로 제공합니다. 이 시스템은 음성 추출, 전사 및 100개 이상 언어 번역을 거쳐 원본 화자의 목소리를 모방하여 자연스럽게 더빙할 수 있게 합니다.
핵심 포인트
- 영상 오디오 전체를 다국어로 처리하는 통합 솔루션입니다.
- Whisper로 전사하고, 원본 목소리 복제 기술로 더빙합니다.
- 음성 분리(Demucs), 전사(Whisper) 등 여러 AI 기능을 통합했습니다.
- 오픈 소스로 기본 기능은 무료이며 다양한 OS에서 작동합니다.
이 모든 것을 무료로 처리하는 도구가 공개되었습니다. 이미 GitHub에서 순식간에 스타(star)가 10,000개를 넘어섰습니다.
'YouTube 영상 전체 다국어 더빙 머신' 같은 것이 출시되었는데, 이름은 Voice-Pro입니다.
- 해외 영상에서 사람의 목소리만 추출함
- 음성을 전사(transcribe)하고 100개 이상의 언어로 번역함
- 원본 화자의 목소리를 모방하여 다른 언어로 더빙함
등—AI가 영상의 전체 오디오 측면을 처리할 수 있게 해주는 시스템입니다.
놀라운 점은, 단순히 기계적인 합성 음성으로 번역된 자막을 읽는 것이 아니라, '원본 화자의 목소리 자체'를 사용하여 다른 언어로 더빙할 수 있다는 것입니다.
과정은 다음과 같습니다: Whisper라는 음성-텍스트 AI로 영상의 오디오를 전사(transcribe) →
이것은 본질적으로 '자막으로 의미를 따라가는 것'에서 '모국어 목소리로 그대로 듣는 것'으로의 전환입니다.
지금까지 개별 소프트웨어로 하던 작업들이 브라우저 한 화면에 통합되었습니다.
- 음성과 BGM을 분리하는 AI (Demucs)
- 음성을 문자로 변환하는 AI (Whisper)
- 목소리를 복사하여 더빙하는 AI (F5-TTS 등)
예를 들어, '영어 해설 영상을 일본어 더빙 버전으로 만들고 싶다'라고 생각한다면,
① YouTube URL을 붙여넣어 영상 가져오기
② 음성과 BGM 분리 후, 말을 일본어로 번역하기
③ 원본 화자의 목소리를 복사하여 일본어로 더빙하기
실제 리포지토리는 여기입니다:
https://github.com/abus-aikorea/v oice-pro
오픈 소스라 기본 기능은 무료이며, Windows / Mac / Linux에서 작동합니다 (고품질의 일부 오디오만 외부 유료 서비스 연동이 필요).
참고한 원 포스트는 여기입니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 X @so_ainsight (자동 발견)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기