Stable Audio 2.5

Stable Audio 2.5
Stability AI · Audio Generation
POST /v1/audio/generations

Up-to-3-minute áudio do texto com text-to-audio, audio-to-audio e inpainting de áudio para produção musical, design de som e remixagem.

De um olhar

CampoValor
ID do modelostable-audio-2-5
Data de lançamento do modelo2025-09-10
Modalidades de entradaTexto
Modalidades de saídaÁudio
Janela de contexto-
Precisão do peso-
Característicasmusic_generation, text_to_audio, sound_effects
Inferência nativaNão
NovoNão
Endpoints suportadosPOST /v1/audio/generations

Precificação

CargaEspecificaçãoTaxa
Geraçãopor geração$0.68

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "stable-audio-2-5", "prompt": "warm jazz piano", "duration": 8}'

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
promptStringsim-O que gerar.
modeenumNão"text-to-audio"O audio-inpaint regenera uma janela de [mask_start, mask_end] de um clipe existente, mantendo o restante. · Permitido: text-to-audio, audio-to-audio, audio-inpaint
output_formatenumNão"mp3"Formato de arquivo de mídia de saída (mp3, wav, mp4, png, jpg, etc., dependendo do endpoint). · Permitido: mp3, wav
durationNúmeroNão190Segundos. Até 3 minutos e 10 segundos. · Alcance: 1 – 190
stepsNúmeroNão8Etapas de difusão. O modelo turbo 2.5 é ajustado para contagem de passos muito baixa. · Alcance: 4 – 8
cfg_scaleNúmeroNão1Orientação sem classificadores. O modelo turbo usa CFG pequeno por padrão. · Intervalo: 1 – 25
strengthNúmeroNão0.5Apenas áudio para áudio. 0,01 = ignorar referência, 1 = ficar próximo à referência. · Alcance: 0,01 – 1
mask_startNúmeroNão-Início da janela de pintura (segundos). Necessário para a entrada de áudio. · Intervalo: 0 – 190
mask_endNúmeroNão-Fim da janela de pintura (segundos). Necessário para a entrada de áudio. · Intervalo: 0 – 190
random_seedBooleanoNãoVerdadeSe for verdade, use uma seed aleatória a cada chamada.
seedNúmeroNão-Semente de reprodutibilidade. Usado apenas quando random_seed=falso.
audio_urlStringNão-Consulte a URL de áudio para audio-to-audio / inpaint.

Notas

Adiciona o modo audio-inpaint (regenerar uma janela de tempo) sobre o Stable Audio 2.0.

Requisitos de modo

  • Áudio-para-áudio e áudio-inpaint exigem AMBOS um prompt e um arquivo de áudio enviado
  • Áudio-para-áudio usa o áudio de referência para style/conditioning, NÃO para clonagem de voz

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-5.