본문으로 건너뛰기

© 2026 Molayo

GitHub요약2026. 04. 26. 08:51

OpenAI 호환 TTS 서버: Microsoft VibeVoice-Realtime-0.5B

요약

marhensa/vibevoice-realtime-openai-api 는 Microsoft 의 VibeVoice-Realtime-0.5B 모델을 기반으로 한 OpenAI API 호환 텍스트 음성 변환 (TTS) 서버입니다. Docker 또는 Python 가상환경으로 쉽게 배포 가능하며, CUDA 최적화를 통해 고성능 추론을 지원합니다. 다양한 목소리를 제공하며 OpenAI의 기존 API 와 호환되는 별칭(alias) 을 사용하여 기존 워크플로우에 원활하게 통합할 수 있습니다.

핵심 포인트

  • Microsoft VibeVoice-Realtime-0.5B 모델을 기반으로 한 경량 TTS 서버를 제공합니다.
  • OpenAI API 호환 인터페이스를 지원하여 기존 클라이언트 코드 변경 없이 연동 가능합니다.
  • Docker 및 Python venv 설치 옵션을 제공하며 CUDA 가속 최적화가 적용되어 있습니다.
  • 다양한 목소리 (voices) 를 지원하고 OpenAI 스타일의 별칭(alias) 을 제공합니다.

marhensa/vibevoice-realtime-openai-api

Repository: marhensa/vibevoice-realtime-openai-api
Language: Python
Stars: 75
Forks: 12
Topics: docker, openwebui, roleplay, tts-api

Description:
OpenAI API-compatible text-to-speech server using Microsoft VibeVoice-Realtime-0.5B. Docker or Python venv support, multiple voices with OpenAI aliases, CUDA-optimized.

AI 자동 생성 콘텐츠

본 콘텐츠는 GitHub ML Hardware의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
4

댓글

0