Claude Code에 프롬프트를 받아쓰기할 수 있는 무료 Windows 앱을 만들었습니다
요약
Claude Code 사용자의 생산성을 높이기 위해 개발된 무료 Windows용 음성 받아쓰기 앱 'Pipevoice'를 소개합니다. 푸시 투 토크 방식으로 작동하며, 말하는 내용을 다듬어 커서가 있는 모든 앱에 텍스트로 입력해 줍니다.
핵심 포인트
- Claude CLI뿐만 아니라 Cursor, 브라우저 등 모든 앱에서 사용 가능
- Deepgram, OpenAI Whisper, 로컬 Whisper 등 다양한 엔진 선택 지원
- Gemini, OpenRouter, Ollama를 통한 텍스트 클린업 기능 제공
- 로컬 모델 사용 시 오디오 데이터의 외부 유출 방지 가능
- GitHub에 공개된 무료 오픈소스 프로젝트
저는 분당 약 150단어 정도 말하고, 타이핑은 아마 40단어 정도 합니다. 제가 사용하는 Claude Code 프롬프트 대부분이 길고 장황한 내용이라서, 저는 말을 하다가 중간에 머뭇거리거나 더듬는 부분이 많습니다. 그래서 실제로 입력하는 내용은 방금 말했던 것보다 짧고 못한 버전이 되곤 했습니다. Anthropic의 /voice 기능도 도움이 되었지만, 그것은 Claude CLI 내부에서만 타이핑을 지원하며, 저는 하루 종일 여러 개의 창을 사용합니다. Wispr Flow를 살펴봤는데 연간 144달러나 하고, 제가 원했던 앱별(per-app) 기능을 여전히 제공하지 못했습니다. 그래서 주말 동안 저만의 것을 만들었습니다. 이름은 Pipevoice입니다.
[IMG:N]
푸시 투 토크(Push-to-talk) 방식입니다. 키를 누르고, 말을 하다가, 손을 떼면, 다듬어진 텍스트가 포커스된 어떤 앱이든 실제 키 입력처럼 나타납니다. 이 게시물에는 Claude에 긴 더듬거리는 지침을 받아쓰기하는 3분짜리 데모가 있습니다. 필러 워드(filler words)나 '음...' 같은 말을 제거하고, 그 내용 전체가 터미널에 도달하기 전에 어떻게 처리되는지 볼 수 있습니다. 그리고는 그냥 실행됩니다.
제가 정말 신경 쓴 부분은 이것입니다: Claude CLI뿐만 아니라 모든 곳에 타이핑된다는 점입니다. Cursor, 브라우저, 채팅창 등 커서가 있는 어디든 말이죠. 앱별 프로필도 존재합니다. 제 터미널에서는 AI 클린업 과정을 건너뛰고 자동으로 Enter를 누르기 때문에, 원본 단어 그대로 손을 쓰지 않고 입력됩니다. 채팅창의 경우, 다듬어서 전송합니다.
각 단계에서 엔진을 선택할 수 있습니다. 가장 빠른 Deepgram으로 전사(Transcribe)하거나, 정확도가 가장 높은 OpenAI Whisper를 사용하거나, 오프라인으로 사용하고 싶다면 로컬 Whisper를 사용할 수 있습니다. 클린업은 선택 사항이며 Gemini의 무료 티어, OpenRouter의 무료 모델 또는 로컬 Ollama를 통해 실행됩니다. 제가 그렇게 만든 이유는, 로컬 Whisper와 Ollama를 결합하면 어떤 오디오도 기기 외부로 나가지 않기 때문입니다. 저는 고객사 코드를 다루는 일을 하기에 그 오디오를 어딘가에 전송하고 싶지 않았습니다.
무료이며 계정이 필요 없고, 소스 코드는 GitHub에 있습니다. 제가 혼자 만들었기 때문에 아직 부족한 부분이 많습니다. 그래서 솔직히 누가 어떤 부분에서 문제가 생기는지, 또는 무엇이 거슬리는지 듣고 싶습니다. 특히 하루 종일 Claude Code를 사용하는 분들의 의견을 듣고 싶습니다. Anthropic과 관련은 없습니다. 그저 제가 스스로의 필요를 채우기 위해 만든 것입니다.
제출자: /u/powleads
[link] [comments]
AI 자동 생성 콘텐츠
본 콘텐츠는 r/ClaudeAI의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기