본문으로 건너뛰기

© 2026 Molayo

X요약2026. 06. 16. 13:09

Apple Silicon에서 로컬로 실행되는 macOS 터미널용 음성-텍스트 변환 및 중-영 번역 도구

요약

Apple Silicon의 GPU를 활용하여 인터넷 연결 없이 로컬에서 실행되는 macOS용 음성-텍스트 변환 및 중-영 번역 터미널 도구입니다. 실시간 자막 출력과 화자 분리 기능을 제공하며, Two-pass 교정 방식을 통해 번역 정확도를 높였습니다.

핵심 포인트

  • Apple Silicon GPU 기반의 로컬 실행으로 보안 및 오프라인 환경 지원
  • 실시간 ASR 전사와 Hunyuan MT를 이용한 중-영 번역 기능
  • 저지연 자막 출력 후 문장 단위로 재해석하는 Two-pass 교정 방식 적용
  • 화자 분리(S1/S2) 및 마이크/스피커 동시 녹음 지원

Apple Silicon에서 로컬로 음성-텍스트 변환(Speech-to-Text) + 중-영 번역을 실행하는 하나의 macOS 터미널 도구입니다. 마이크 또는 회의 오디오를 입력하면 실시간 자막과 번역이 출력되며, 전 과정 동안 인터넷 연결이 필요하지 않습니다.

Apple GPU에서 로컬로 실행되어 인터넷 연결이 필요 없습니다. 스트리밍 ASR(Automatic Speech Recognition)로 영어를 전사하고 → Hunyuan MT로 중국어로 번역하며, 화자 분리(S1/S2 표시) 기능이 포함되어 있습니다. 라이브 회의 시 자신의 마이크와 상대방의 스피커 소리를 동시에 녹음할 수 있습니다. Two-pass 교정 방식을 사용합니다: 먼저 저지연(low-latency) 자막을 출력한 뒤, 문장이 끝나면 문장 전체를 다시 해석하여 교정합니다. 모델은 처음 실행 시 자동으로 다운로드되며, 총 용량은 3GB 이상입니다. 출력은 터미널 또는 Markdown 파일로 가능합니다.

AI 자동 생성 콘텐츠

본 콘텐츠는 X @qingq77 (검증됨)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
0

댓글

0