Stable Audio 2.0

Stability AI · Audio Generation
POST /v1/audio/generationsGera áudio de até 3 minutos a partir de prompts de texto, suportando text-to-audio e audio-to-audio com duração, passos e escala CFG ajustáveis.
De um olhar
Precificação
Exemplo de pedido
Parâmetros
Notas
Gera até 3 minutos de áudio a partir de texto ou por meio de transformação audio-to-audio.
Modo áudio para áudio
- Requer TANTO um prompt quanto um arquivo de áudio enviado
- Escala CFG recomendada: 7-15
- Passos recomendados: 6-8
- Força típica: 0,3-0,7
Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-0.
