Raspberry Pi에서 실행할 수 있는 무료 오픈 소스 Alexa 스타일의 어시스턴트를 만들었습니다
요약
LLM 기반의 오픈 소스 음성 어시스턴트인 OpenLily를 소개합니다. Ollama를 활용해 로컬 LLM과 음성 인식/합성 모델을 결합할 수 있으며, 다양한 도구와 연동하여 커스터마이징이 가능합니다.
핵심 포인트
- Ollama를 통한 로컬 LLM 및 음성 모델 실행 지원
- 이메일, Slack 등 다양한 도구와 연동 가능한 에이전트 하네스 제공
- Raspberry Pi 등 다양한 환경에서 실행 가능
- 사용자 요구에 맞춘 개인화된 음성 인터페이스 구축 가능
안녕하세요 여러분, Ryan입니다!
요약 (Summary)
저는 LLM (Large Language Models) 기반의 오픈 소스 음성 어시스턴트인 OpenLily를 만들었습니다. 핵심 에이전트 하네스 (agent harness)는 쉽게 커스터마이징할 수 있어, 어떤 도구(이메일 확인, Slack 확인 등)와 함께든 어떤 LLM (gpt-5.5, opus 4.8 등)도 사용할 수 있습니다.
또한 Ollama를 통해 로컬 LLM을 로컬 음성 인식 (Speech to Text) 및 음성 합성 (Text to Speech) 모델과 함께 사용하는 것도 가능합니다. 이 방식을 사용하면 외부 제공업체와 통합할 필요가 없습니다.
왜 만들었나요? (Why?)
저는 Alexa가 출시되어 큰 화제가 되었던 아주 오래전부터 Alexa를 사용해 왔습니다. 하지만 평소 ChatGPT에 물어보던 간단한 질문들에 답하는 데 있어서는 항상 제 기대에 미치지 못했습니다. 제가 Alexa를 사용하는 용도는 Spotify에서 음악을 재생하거나 날씨를 확인하는 것뿐입니다 😅
게다가, 저는 제 요구사항에 딱 맞게 커스터마이징할 수 있는 어시스턴트를 원했습니다 (예를 들어, 매일 아침 최신 Hacker News 업데이트 내용을 한꺼번에 가져다주는 것과 같은 기능).
누구를 위한 것인가요? (Who is this for?)
만약 여러분이 저처럼 특정 주제(기술적인 질문, 새로운 분야에 대한 학습, 새로운 뉴스 파헤치기 등)에 대해 LLM과 자주 대화한다면, 이 프로젝트가 여러분의 삶을 더 편하게 만들어 줄 수 있습니다.
저는 일상적인 LLM 대화를 할 때 침대에 누워 개인화된 음성 어시스턴트와 대화하는 것이 훨씬 더 편리하다고 느낍니다. 대부분의 경우 무언가(예: LLM 아키텍처)를 배우려고 할 때 그렇습니다.
요즘 저는 ChatGPT를 열고, 타이핑하고, 그 모든 텍스트를 읽는 것이 너무 귀찮거든요 lol.
어디에서 실행하나요? (Where to run it?)
Mac, Mac mini 또는 다른 어떤 장치에서도 실행할 수 있습니다.
스피커폰이 연결된 Raspberry Pi에서 실행하는 것은 매우 간단합니다. 제가 제 침실에서 어시스턴트와 대화하는 영상을 첨부했습니다 :)
직접 시도해보고 싶은 분들을 위한 리포지토리(repo)는 여기 있습니다: https://github.com/getlark/openlily
질문이 있다면 기꺼이 답변해 드리겠습니다.
AI 자동 생성 콘텐츠
본 콘텐츠는 Dev.to AI tag의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.
원문 바로가기