Qwen3-tts.cpp + Compose Desktop GUI

제 RTX 5080에서 qwen3-tts.cpp 구현을 약 5배의 실시간 속도(5x realtime)로 개선했습니다. GGML 기반이므로 어디에서나 컴파일 및 실행이 가능해야 하지만, 저는 Windows 및 Linux 환경의 CPU 및 CUDA에서만 테스트했습니다: https://github.com/Danmoreng/qwen3-tts.cpp

추가로 Kotlin Compose Multiplatform을 사용하여 Windows 및 Linux에서 작동하는 데스크톱 GUI를 제작했습니다: https://github.com/Danmoreng/qwen-tts-studio

직접 다운로드하여 실행할 수 있는 Windows 릴리스가 존재합니다. Linux는 소스에서 직접 빌드해야 합니다.

Qwen-TTS-Studio

기능:

제가 아는 가장 빠른 GGML 구현체, Python 레퍼런스보다 15배 빠름
0.6B 및 1.7B 모델
음성 복제 (voice cloning) 기능이 포함된 베이스 모델
지침(instructions)이 포함된 customvoice 모델
지침(instructions)이 포함된 voicedesign
화자 임베딩 (speaker embeddings) 저장
화자 임베딩 혼합 및 병합 (mix & merge)
스트리밍 (반정확한 텍스트 하이라이팅 포함)
huggingface(https://huggingface.co/Serveurperso/Qwen3-TTS-GGUF)에서 사전 변환된 GGUF 모델을 다운로드할 수 있는 옵션 포함

submitted by /u/Danmoreng
[link] [comments]

Insights

Qwen3-tts.cpp + Compose Desktop GUI

요약

핵심 포인트

댓글

체화된 에이전트 피드백 루프를 활용한 유산 언어(Heritage Language) 부흥 프로그램을 위한 생성적 시뮬레이션 벤치마킹

현대의 MVP는 단순히 작은 앱이 아니라, 검증된 워크플로우(Workflow)입니다

700달러짜리 GPU가 월 412달러의 AI 구독 모델을 파괴했습니다

AI 기초부터 시작하기: Rust로 첫 번째 뉴런 구현하기

현대의 MVP는 단순히 작은 앱이 아니라, 검증된 워크플로우(Workflow)입니다

700달러짜리 GPU가 월 412달러의 AI 구독 모델을 파괴했습니다

AI 기초부터 시작하기: Rust로 첫 번째 뉴런 구현하기