본문으로 건너뛰기

© 2026 Molayo

r/SelfHosted요약2026. 05. 06. 19:59

Speakr v0.8.19 - 로컬 오디오/비디오 전사 앱 업데이트

요약

Speakr v0.8.19는 로컬 오디오/비디오 전사 앱의 대규모 업데이트를 제공하며, 사용자 경험과 기능적 유연성을 크게 향상시켰습니다. 주요 개선 사항으로는 요약 프롬프트에 `{{placeholder}}`와 같은 변수를 포함하여 회의록 등 외부 컨텍스트를 동적으로 주입할 수 있게 된 점이 있습니다. 또한, 업로드별/태그별/폴더별 전사 모델 선택 기능과 OpenAI 호환 API 지원을 통한 임베딩 파이프라인의 유연성이 강화되었습니다.

핵심 포인트

  • **동적 프롬프트 변수:** 요약 시 회의록이나 커스텀 지침 등 외부 컨텍스트를 `{{placeholder}}` 형태로 주입하여 요약 품질을 높일 수 있습니다.
  • **모델 선택 유연성:** 업로드, 태그, 폴더별로 전사 모델(예: WhisperX)을 개별적으로 지정할 수 있어 비용 효율적이고 정확한 처리가 가능합니다.
  • **임베딩 API 확장:** OpenAI 호환 API를 통해 vLLM, OpenRouter 등 다양한 백엔드를 지원하여 임베딩 파이프라인의 유연성을 극대화했습니다.
  • **API 및 관리 기능 강화:** 폴더 CRUD 엔드포인트, 전사 요청 시 모델/프롬프트 오버라이드 기능 등이 추가되어 시스템 통합과 관리가 용이해졌습니다.

안녕하세요 r/selfhosted, Speakr 업데이트입니다. 이전에 보지 않으셨다면 Speakr 는 로컬 오디오 전사 앱입니다: 오디오/비디오를 기록하거나 업로드하고, 화자별 전사본을 얻은 후 사용자의 LLM 을 사용하여 요약하거나 대화합니다. 마지막 게시 이후 많은 것이 추가되었습니다.

가장 큰 기능적 추가는 프롬프트 템플릿 변수입니다. 요약 프롬프트에는 {{placeholder}} 토큰을 포함할 수 있습니다. 요약 프롬프트에 {{agenda}} 를 언급하면 업로드 폼에 회의록 입력이 나타나며, 요약 시 값이 치환됩니다. Generate Summary 옆에 Customise summary prompt 버튼이 있어 저장된 프롬프트를 다시 쓰지 않고 일회성 컨텍스트 (회의록, 커스텀 포커스 지침) 를 전달할 수 있습니다.

업로드별, 태그별, 폴더별 전사 모델 선택이 이제 가능합니다. TRANSCRIPTION_MODELS_AVAILABLE 을 설정하면 업로드 폼, 재처리 모달, 태그/폴더 편집 폼에 모델 드롭다운이 추가됩니다. 연결자가 /v1/models 를 노출하면 관리자 대시보드에서 목록을 큐레이션할 수 있습니다. WhisperX 런타임 모델 전환이 구현되어 업로드별 선택이 실제로 각 파일을 전사하는 모델을 변경합니다. 비용이 많이 드는 diarize 모델을 필요할 때 사용하고 단일 화자 파일 전사 시 일반 모델을 사용할 수 있는 클라우드 기반 제공자와도 함께 사용할 수 있습니다.

임베딩은 이제 OpenAI 호환 API 를 통해 실행할 수 있습니다. EMBEDDING_BASE_URL, EMBEDDING_API_KEY, EMBEDDING_DIMENSIONS 를 설정하면 임베딩 파이프라인이 vLLM, OpenRouter, OpenAI, Together 또는 OpenAI 임베딩 형식을 지원하는 다른任何东西를 통해 라우팅됩니다. 로컬을 유지하고 싶다면 EMBEDDING_MODEL 은 로컬 모델을 교체하며 (어떤 sentence-transformers 임베딩 모델이든 작동합니다).

Inquire 모드는 대형 라이브러리에서 훨씬 더 빠릅니다. 또한 폴더 CRUD 엔드포인트 (/api/v1/folders), 연결자 발견 엔드포인트, 기록 응답 필드 패리티 (audio_duration, durations, folder, events, deletion_exempt, 프롬프트 변수, 전사 모델), 전사 엔드포인트의 요청별 transcription_model / hotwords / initial_prompt 오버라이드, 폴더를 통한 기록 이동 및 필터링 (?folder_id=PATCH folder_id(단일 및 배치)) 가 추가되었습니다. OpenAPI 스키마는 모두 반영합니다.

또한 포르투갈어 브라질 번역이 추가되었습니다 (기여자 lhpereira 덕분에).

업그레이드는 일반적인 docker compose pull && docker compose up -d 입니다.

GitHub | Screenshots | Quick Start | Docker Hub

AI 자동 생성 콘텐츠

본 콘텐츠는 r/SelfHosted (AI filter)의 원문을 AI가 자동으로 요약·번역·분석한 것입니다. 원 저작권은 원저작자에게 있으며, 정확한 내용은 반드시 원문을 확인해 주세요.

원문 바로가기
1

댓글

0