Stable Audio 3 출시를 발표합니다!

HarmonAI Discord 서버에서 직접 가져온 내용입니다.

음악 및 음향 효과(SFX)를 위한 새로운 텍스트-오디오(text-to-audio) 모델 제품군인 Stable Audio 3의 출시를 발표하게 되어 기쁩니다. 여기에는 새로운 오픈 웨이트 (open-weights) 모델이 포함됩니다! 저희는 오늘 Hugging Face를 통해 세 가지 모델을 공개하며, Stable Audio 3 추론 (inference) 및 LoRA 미세 조정 (fine-tuning)에 특화된 GitHub 저장소도 함께 공개합니다.

Stable Audio 3 Small Music (https://huggingface.co/stabilityai/stable-audio-3-small-music)
Stable Audio 3 Small SFX (https://huggingface.co/stabilityai/stable-audio-3-small-sfx)
Stable Audio 3 Medium (https://huggingface.co/stabilityai/stable-audio-3-medium)

Stable Audio 3 GitHub: https://github.com/Stability-AI/stable-audio-3

Medium 모델은 최대 6분 20초 길이의 음악과 음향 효과를 생성하며, NVIDIA GPU에서 단 몇 초 만에 추론이 가능합니다.

Small 모델들은 (각각) 최대 2분 길이의 음악과 음향 효과를 생성하며, CPU에서 효율적으로 실행되도록 최적화할 수 있습니다.

이 모델들은 Stability AI Community License에 따라 라이선스가 부여되므로, 개인적 및 창의적 용도로 사용하는 것은 완전히 무료입니다.

저희는 모델 출력물에 대해 어떠한 로열티나 소유권도 주장하지 않으며, 출력물은 귀하가 원하는 대로 자유롭게 사용하실 수 있습니다.

저희는 이 모델과 모델의 기반이 되는 새로운 SAME 오토인코더 (autoencoder) 아키텍처에 관한 두 편의 학술 논문도 발표했습니다.
Stable Audio 3 논문: https://arxiv.org/abs/2605.17991
SAME 논문: https://arxiv.org/abs/2605.18613

블로그 포스트: https://stability.ai/news-updates/meet-stable-audio-3-the-model-family-built-for-artistic-experimentation-with-open-weight-models

데모 링크: https://stableaudio.com/generate

Insights

Stable Audio 3 출시를 발표합니다!

요약

핵심 포인트

댓글

나는 제휴 코드를 운영하고 있다. 가짜 코드 7개가 내 코드를 앞지르고 있으며, Google의 AI는 그것들을 믿고 있다.

설명(Description)은 로딩을 트리거해야 하며, 컨텍스트를 저장해서는 안 됩니다

Claude Code × OpenRouter 무료 모델: 비용 $0로 자율 주행하는 AI 코딩 환경을 3단계로 구축하기

AI의 자기 개선 루프는 '외부 검증'으로 결정된다: Copilot의 사전 지시(Custom Instructions)에 담아야 할 설계

나는 제휴 코드를 운영하고 있다. 가짜 코드 7개가 내 코드를 앞지르고 있으며, Google의 AI는 그것들을 믿고 있다.

설명(Description)은 로딩을 트리거해야 하며, 컨텍스트를 저장해서는 안 됩니다

Claude Code × OpenRouter 무료 모델: 비용 $0로 자율 주행하는 AI 코딩 환경을 3단계로 구축하기

AI의 자기 개선 루프는 '외부 검증'으로 결정된다: Copilot의 사전 지시(Custom Instructions)에 담아야 할 설계