강력한 음성 클로닝 모델을 담은 종합 GitHub 저장소 공개

이거 정말 엄청나게 강력하게 느껴진다.

누군가 조용히 GitHub에 가장 완벽한 음성 클로닝(voice cloning) 디렉토리를 만들었고, 그 안의 모든 모델이 무료다.

이렇게 생각해 보세요: 어떤 소리의 3초만 녹음합니다. 업로드하고 '실행'을 누릅니다. 인공지능(AI)이 바로 그 목소리, 당신의 언어, 당신의 감정으로 즉시 말하게 합니다.

예전에는 돈이 들던 것이었습니다. 이제는 아닙니다.

저장소의 범위:

→ 35개 이상의 음성 클로닝 모델과 나란히 비교하는 기능들
→ 보컬이 포함된 전체 노래를 작성하는 음악 생성 모델들
→ 오래되거나 손상된 녹음을 정리하는 음성 복원 도구들
→ 실시간으로 전사(transcription)를 수행하는 음성 인식 시스템들

주목할 만한 Supertonic 2. 완전히 기기에서 작동하며, 인터넷이 필요 없고, ElevenLabs보다 42배 빠르게 음성을 생성합니다. 서버가 아닌 일반 노트북에서도 가능합니다.

스튜디오들은 이런 종류의 음성 스택에 매달 월 수천 달러를 지불합니다.

그런데 이 저장소는 이 모든 것을 무료로 제공하고 있습니다.

100% 오픈 소스.

Insights