Stable Audio 2.5

Stable Audio 2.5
Stability AI · Audio Generation
POST /v1/audio/generations

Up-to-3-minute audio de texto con text-to-audio, audio-to-audio e inpainting de audio para producción musical, diseño de sonido y remezclas.

A simple vista

CampoValor
ID de modelostable-audio-2-5
Fecha de lanzamiento del modelo2025-09-10
Modalidades de entradaTexto
Modalidades de salidaAudio
Ventana de contexto-
Precisión del peso-
Característicasmusic_generation, text_to_audio, sound_effects
Inferencia nativaNo
NuevoNo
Puntos finales soportadosPOST /v1/audio/generations

Precios

CargaEspecificacionesTarifa
Generaciónpor generación$0.68

Solicitud de ejemplo

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "stable-audio-2-5", "prompt": "warm jazz piano", "duration": 8}'

Parámetros

ParámetroTipoObligatorioDefaultDescripción
promptCuerda-Qué generar.
modeenumno"text-to-audio"Audio-Inpaint regenera una ventana de [mask_start, mask_end] de un clip existente manteniendo el resto. · Permitidos: text-to-audio, audio-to-audio, audio-inpaint
output_formatenumno"mp3"Formato de archivo multimedia de salida (mp3, wav, mp4, png, jpg, etc., dependiendo del punto final). · Permitidos: mp3, wav
durationNúmerono190Segundos. Hasta 3 minutos y 10 segundos. · Rango: 1 – 190
stepsNúmerono8Pasos de difusión. El modelo turbo 2.5 está ajustado para un número de pasos muy bajo. · Rango: 4 – 8
cfg_scaleNúmerono1Guía sin clasificador. El modelo turbo utiliza por defecto un pequeño CFG. · Rango: 1 – 25
strengthNúmerono0.5Solo audio a audio. 0,01 = ignorar referencia, 1 = mantenerse cerca de la referencia. · Rango: 0,01 – 1
mask_startNúmerono-Inicio de ventana de pintura (segundos). Necesario para la entrada de audio. · Rango: 0 – 190
mask_endNúmerono-Extremo de la ventana de pintura (segundos). Necesario para la entrada de audio. · Rango: 0 – 190
random_seedBooleanonoCiertoSi es cierto, usa una semilla aleatoria en cada llamada.
seedNúmerono-Semilla de reproducibilidad. Solo se usa cuando random_seed=falso.
audio_urlCuerdano-Consulta la URL de audio para audio-to-audio / inpaint.

Notas

Añade el modo audio-inpaint (regenerar una ventana temporal) encima de Stable Audio 2.0.

Requisitos de modo

  • Audio-to-audio y audio-inpaint requieren AMBOS un prompt y un archivo de audio subido
  • El audio-a-audio utiliza el audio de referencia para style/conditioning, NO para clonación de voz

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-5.