A C++ port of Echo-TTS

Echo-TTS (https://github.com/jordandare/echo-tts) 의 C++ 포팅 - 스피커 참조 조건화 (speaker reference conditioning) 를 갖춘 다중 스피커 TTS 모델입니다. CUDA 를 통해 GPU 상에서 실행되며, 확산 트랜스포머 (diffusion transformer) 에는 GGML 을, DAC 자동엔코더에는 ONNX Runtime 을 사용합니다.

Highlights:

~3.3 GB (Q8) 또는 ~5.6 GB (F16) 모델 파일
오픈 AI 호환 서버 모드 (chunking 포함)
참조 WAV 조건화를 통한 다중 음성 지원
CUDA 12.8, cuDNN 9.21, ONNX Runtime 을 포함한 사전 구축된 포터블 ZIP 파일 제공
Euler 샘플링 및 설정 가능한 CFG, 블록 기반 생성, 컨티뉴이션 모드

Links:

코드: github.com/Cirius0310/echo-tts-cpp
모델: huggingface.co/tmdarkbr/echo-tts-gguf
예제: (https://github.com/Cirius0310/echo-tts-cpp/tree/master/examples)

참고: 현재는 Windows 에서만 테스트 완료, Linux 는 YMMV 입니다.

Credits:

Echo-TTS by Jordan Darefsky
GGML by ggerganov & contributors
Fish Speech S1-DAC 자동엔코더
WhisperD 텍스트 포맷

Insights

A C++ port of Echo-TTS

요약

핵심 포인트

댓글

OpenSCAP 및 CIS, STIG, NIST와 같은 준수 표준을 사용하여 Linux 운영 시스템을 강화(Hardening)하는 단계별 지침

이달의 네트워킹 - 2026년 6월

Manus 팀이 Offloop를 통해 방금 보여준 것을 이해하시나요?

스스로 수익을 창출하는 워크플로우 내 AI 에이전트 배포하기

OpenSCAP 및 CIS, STIG, NIST와 같은 준수 표준을 사용하여 Linux 운영 시스템을 강화(Hardening)하는 단계별 지침

이달의 네트워킹 - 2026년 6월

Manus 팀이 Offloop를 통해 방금 보여준 것을 이해하시나요?

스스로 수익을 창출하는 워크플로우 내 AI 에이전트 배포하기