Phoronix헤드라인2026. 06. 18. 11:41

Ubuntu 데스크톱을 위한 음성-텍스트 변환(Speech-To-Text) 솔루션 Myna 발표

요약

Canonical이 Ubuntu 데스크톱을 위한 로컬 음성-텍스트 변환(STT) 솔루션인 Myna를 발표했습니다. Ubuntu 26.10을 목표로 하며, 인터넷 연결 없이 기기 내에서 로컬로 실행되는 음성 인식 기능을 제공합니다.

핵심 포인트

Ubuntu 데스크톱을 위한 로컬 STT 솔루션 Myna 발표
Ubuntu 26.10 출시를 목표로 데스크톱 받아쓰기 기능 구현
인터넷 연결이 필요 없는 로컬 음성 모델 처리 지원
Wayland 및 GNOME 환경을 우선적으로 지원

Ubuntu 데스크톱을 위한 음성-텍스트 변환(Speech-To-Text) 솔루션 Myna 발표

Myna는 Canonical이 Ubuntu 데스크톱을 위해 개발 중인 음성-텍스트 변환(speech-to-text) 솔루션입니다. 현재까지 GPLv3 라이선스가 적용된 Myna의 GitHub 저장소에는 문서만 포함되어 있으며, 다음과 같이 설명되어 있습니다:

"이 프로젝트의 이름은 놀라운 명료함으로 인간의 말을 듣고, 흉내 내고, 재현하는 능력으로 유명한 새인 마이나(myna)에서 따왔습니다. 이 조류와 마찬가지로, 이 애플리케이션은 음성 오디오를 마스터하도록 설계되었습니다. 즉, 사용자의 말을 주의 깊게 듣고 이를 정확하고 깨끗한 텍스트로 즉시 변환합니다. 핸즈프리로 텍스트를 받아쓰거나, 접근성(accessibility)을 개선하거나, 워크플로(workflow)를 간소화하고자 하는 경우, myna는 Linux 생태계에 원활한 음성 인식 기능을 직접 제공합니다."

Canonical 데스크톱 팀의 Jean Baptiste Lallement은 Ubuntu Discourse를 통해 Myna에 대한 더 자세한 내용을 공유했습니다. Ubuntu 26.10을 목표로 그들은 신뢰할 수 있는 데스크톱 받아쓰기(dictation)를 통한 "기본 기능"을 지향하고 있습니다:

"초기 경험은 간단할 것입니다. 키보드 단축키를 누르고 자연스럽게 말하면, 사용 중인 애플리케이션에 결과 텍스트가 나타나는 것을 볼 수 있습니다. Myna는 받아쓰기가 활성화되어 있는 동안 명확한 시각적 피드백과 함께 음성 인식(speech recognition)을 제공하도록 설계되었습니다.

내부적으로 Myna는 사용자의 기기에서 로컬로 실행되는 음성 인식 모델을 사용합니다. 초기 릴리스는 Wayland 기반의 Ubuntu Desktop을 대상으로 하며, GNOME을 주요 검증된 환경으로 설정합니다. 동시에 향후 추가적인 데스크톱 환경을 지원할 수 있도록 아키텍처를 충분히 개방적으로 유지할 것입니다."

이번 초기 Ubuntu 26.10 마일스톤(milestone)에서는 음성 비서, 음성 명령, 데스크톱 제어, 번역 또는 기타 기능을 목표로 하지 않으며, 현재로서는 음성-텍스트 변환을 위한 데스크톱 받아쓰기에만 집중하고 있습니다.

Myna는 음성 모델에 대한 모든 로컬 처리(local processing)를 지원하므로, 언어 모델(language model)을 다운로드한 후에는 인터넷 연결이 필요하지 않습니다.

Myna 프로젝트에 대해 더 자세히 알고 싶은 분들은 Ubuntu Discourse를 통해 확인할 수 있습니다.

AI 자동 생성 콘텐츠

원문 바로가기

Ubuntu 데스크톱을 위한 음성-텍스트 변환(Speech-To-Text) 솔루션 Myna 발표

요약

핵심 포인트

Ubuntu 데스크톱을 위한 음성-텍스트 변환(Speech-To-Text) 솔루션 Myna 발표

댓글