cjpais/Handy
요약
Handy는 클라우드 연결 없이 사용자의 로컬 컴퓨터에서 작동하는 무료, 오픈 소스 음성-텍스트 변환(STT) 데스크톱 애플리케이션입니다. 이 앱은 단축키를 통해 녹음하고, Whisper나 Parakeet 같은 최신 모델을 사용하여 오디오를 텍스트로 전사한 후, 사용 중인 어떤 앱에도 쉽게 붙여넣을 수 있도록 설계되었습니다. 가장 큰 특징은 강력한 개인정보 보호 기능으로, 모든 음성 데이터 처리가 기기 내부에서 이루어지며, 개발자가 '최고의' 제품이 되기보다 '가장 포크 가능한(forkable)' 도구가 되는 데 초점을 맞추었다는 점입니다. Windows, macOS, Linux 등 다양한 플랫폼을 지원하며 Tauri와 Rust를 기반으로 구축되어 높은 확장성과 시스템 통합성을 자랑합니다.
핵심 포인트
- 완벽한 오프라인 작동: 모든 음성 전사 과정이 로컬 컴퓨터에서 이루어져 개인정보 보호가 완벽하게 보장됩니다.
- 오픈 소스 및 무료: 누구나 자유롭게 사용하고 기여하며, 접근성 도구로서의 가치를 강조합니다.
- 다양한 모델 지원: GPU 가속을 위한 Whisper(Small/Medium/Turbo/Large)와 CPU 최적화 모델인 Parakeet V3를 선택하여 사용할 수 있습니다.
- 크로스 플랫폼 및 시스템 통합: Windows, macOS, Linux에서 작동하며, Tauri와 Rust 기반으로 개발되어 강력한 시스템 단축키 및 전역 접근성을 제공합니다.
- 포크 가능성 강조: 최고의 기능을 갖추기보다 커뮤니티가 함께 발전시킬 수 있는 개방적이고 확장 가능한 도구임을 목표로 합니다.
완전히 오프라인으로 작동하는 무료, 오픈 소스 및 확장 가능한 음성-텍스트 변환 애플리케이션
Handy 는 간단한 프라이버시 중심의 음성 전사 (speech transcription) 를 제공하는 크로스 플랫폼 데스크톱 애플리케이션입니다. 단축키를 누르고 말하면 단어들이 어떤 텍스트 필드에도 나타납니다. 이는 정보를 클라우드에 전송하지 않고 사용자 자신의 컴퓨터에서 발생합니다.
Handy 는 진정한 오픈 소스, 확장 가능한 음성-텍스트 변환 도구를 위한 공백을 메우기 위해 만들어졌습니다. handy.computer 에 명시된 바와 같이:
무료 (Free): 접근성 도구 (Accessibility tooling) 는 유료 장벽 뒤에 있는 것이 아니라 모든 사람의 손에 있어야 합니다.
오픈 소스 (Open Source): 함께 더 발전시킬 수 있습니다. Handy 를 확장하고 더 큰 것에 기여하세요.
개인정보 보호 (Private): 당신의 목소리는 컴퓨터에 머뭅니다. 오디오를 클라우드에 보내지 않고 전사본을 얻으세요.
간단함 (Simple): 하나의 도구, 하나의 작업. 당신이 말한 것을 전사하고 텍스트 상자에 넣습니다.
Handy 는 최고의 음성-텍스트 변환 애플리케이션이 되는 것을 시도하지 않습니다. 가장 포크 가능한 (forkable) 것이 되는 것을 시도합니다.
누르기 (Press): 녹음 시작/정지를 위한 구성 가능한 키보드 단축키를 누르거나 (또는 누르고 말하기 모드 사용)
말하기 (Speak): 단축기가 활성화된 동안 당신의 말을 하세요.
풀어놓기 (Release): Handy 가 Whisper 를 사용하여 당신의 음성을 처리합니다.
받기 (Get): 전사된 텍스트를 사용하고 있는 어떤 앱에도 직접 붙여넣습니다.
전체 과정은 로컬에서 이루어집니다:
-
침묵은 Silero 와 함께 VAD (Voice Activity Detection) 로 필터링됩니다.
-
전사는 모델 선택에 따라 수행됩니다:
Whisper 모델(Small/Medium/Turbo/Large): GPU 가속이 가능한 경우 사용
Parakeet V3: CPU 최적화 모델로 뛰어난 성능과 자동 언어 감지를 제공합니다. -
Windows, macOS, Linux 에서 작동합니다.
-
최신 릴리스는 releases 페이지 또는 웹사이트에서 다운로드하세요.
macOS: 또한 Homebrew cask 를 통해 사용할 수 있습니다:brew install --cask handy
Windows: 또한 winget 을 통해 사용할 수 있습니다:winget install cjpais.Handy
참고: Homebrew cask 와 winget 패키지는 Handy 개발자에 의해 유지 관리되지 않습니다.
- 애플리케이션 설치
- Handy 실행 및 필요한 시스템 권한 (마이크, 접근성) 부여
- 설정에서 선호하는 키보드 단축키 구성
- 전사 시작!
플랫폼별 요구사항을 포함한 상세 빌드 지침은 BUILD.md 를 참조하세요.
Raycast 에서 Handy 를 제어하세요 — 녹음 시작/정지, 전사 기록 내역 탐색, 사전 관리, 모델 및 언어 전환.
Source · by @mattiacolombomc
Handy 는 다음을 결합한 Tauri 애플리케이션으로 구축되었습니다:
프론트엔드: 설정 UI 를 위한 React + TypeScript 와 Tailwind CSS
백엔드: 시스템 통합, 오디오 처리, ML 추론을 위한 Rust
핵심 라이브러리:
whisper-rs
: Whisper 모델 로의 로컬 음성 인식
transcribe-rs
: Parakeet 모델 을 사용한 CPU 최적화 음성 인식
cpal
: 크로스 플랫폼 오디오 I/O
vad-rs
: 음성 활동 감지 (Voice Activity Detection)
rdev
: 전역 키보드 단축키 및 시스템 이벤트
rubato
: 오디오 리샘플링
Handy 는 개발 및 문제 해결을 위한 고급 디버그 모드를 포함합니다. 다음을 눌러 액세스하세요:
macOS: Cmd+Shift+D
Windows/Linux: Ctrl+Shift+D
Handy 는 comm
AI 자동 생성 콘텐츠
본 콘텐츠는 GitHub Trending Rust (weekly)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기