Claude Code에 목소리 부여하기 — 100% 로컬, CPU 전용, 클라우드 없음 (Silero VAD + Parakeet STT +
요약
Claude Code에 100% 로컬 및 CPU 전용으로 작동하는 음성 인터페이스(/talk 스킬)를 추가하는 방법입니다. Silero VAD, Parakeet STT, Supertonic TTS를 활용하여 클라우드 연결 없이 오프라인 환경에서 음성 대화가 가능합니다.
핵심 포인트
- 클라우드 API 없이 로컬 CPU/NPU만으로 작동하는 완전한 오프라인 음성 모드
- Silero VAD, Parakeet STT, Supertonic TTS를 활용한 저지연 루프 구현
- Apple Silicon 및 일반 CPU 환경에서의 성능 벤치마크 데이터 제공
- Claude Code의 사고 과정(CoT)을 필터링하여 실제 답변만 음성으로 출력
- GitHub 오픈소스를 통한 간편한 설치 및 자동 설정 지원
Claude Code에 /talk 스킬이 추가되었습니다 — 명령어 하나로 완전히 오프라인 상태에서 목소리를 직접 연결합니다.
루프 과정:
사용자가 말함 → Silero VAD가 발화 종료를 감지 (~0.09 ms/frame) → Parakeet STT가 CPU에서 전사 (2.4초 문장 기준 ~307 ms) → Claude Code가 이를 처리 → Supertonic TTS 3가 답변을 합성 (~1.4 s) → 사용자가 듣게 됨
클라우드 사용 제로. 어떤 외부 API를 통해서도 라우팅되지 않습니다. 모두 ONNX이며, 모두 로컬에서 작동합니다.
일반 i7-12700KF (GPU 없음)에서의 측정 수치:
단계별 지연 시간 vs 실시간성
Parakeet STT (2.4초 발화) 307 ms 8×
Supertonic TTS (짧은 답변) 1.4 s 1.7×
Apple Silicon M5 Neural Engine 환경: STT는 실시간 대비 33배, TTS는 실시간 대비 16배 속도.
설치 프로그램은 talk 스킬을 Claude Code의 skills 디렉토리에 넣고 systemd (Linux), launchd (macOS), 또는 Task Scheduler (Windows)를 통해 STT + TTS 서버를 자동으로 시작합니다.
설치 방법:
git clone https://github.com/groxaxo/Local-VoiceMode-LLM
cd Local-VoiceMode-LLM && ./setup.sh
대화형 설정 중에 에이전트로 Claude Code를 선택하세요 — 나머지는 모두 자동으로 처리됩니다.
GitHub: https://github.com/groxaxo/Local-VoiceMode-LLM — MIT 라이선스, 무료.
OpenCode CLI, Hermes Agent, OpenClaw, Codex를 사용 중이라면 해당 도구들과도 함께 작동합니다.
수정 사항 (6월 13일) — 게시 이후 몇 가지 변경 사항이 적용되었습니다:
- 리포지토리 이름이 이제 Local-VoiceMode-LLM으로 변경되었습니다 (이전 링크도 여전히 리다이렉트됩니다): https://github.com/groxaxo/Local-VoiceMode-LLM
- 특히 Claude Code 측면에서: 통합 과정에서 TTS에 전달되기 전에 사고 과정 (chain-of-thought)과 도구 출력 (tool output)을 제거하므로, 터미널 노이즈가 아닌 실제 답변만 말하게 됩니다. skills 디렉토리에 talk 스킬로 추가됩니다.
- 이제 재현 가능한 벤치마크 스위트가 있습니다 (python benchmarks/run_benchmark.py). i7-12700KF, CPU 전용: Silero VAD 0.09 ms/frame (~347x), Parakeet STT 실시간 대비 7.9–18.4x, Supertonic 8단계 짧은 답변 ~1.4s (1.7x). Apple M5 Neural Engine 환경: STT ~33x, TTS 최대 ~16x.
- Supertonic 2는 이제 선택 사항인 더 가벼운 엔진(66M 파라미터, :8880, 자동 폴백)으로 제공됩니다.
제출자: /u/blackstoreonline
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/ClaudeAI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기