Stable Audio 2.5

Stable Audio 2.5
Stability AI · Audio Generation
POST /v1/audio/generations

Up-to-3-minute audio à partir du texte avec text-to-audio, audio-to-audio et l’inpainting audio pour la production musicale, la conception sonore et le remix.

En un coup d’œil

TerrainValeur
Identifiant de modèlestable-audio-2-5
Date de sortie du modèle2025-09-10
Modalités d’entréeTexte
Modalités de sortieAudio
Fenêtre de contexte-
Précision du poids-
Caractéristiquesmusic_generation, text_to_audio, sound_effects
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/audio/generations

Tarification

ChargeSpecTaux
Générationpar génération$0.68

Exemple de demande

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "stable-audio-2-5", "prompt": "warm jazz piano", "duration": 8}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
promptCordeOui-Que générer.
modeenumnon"text-to-audio"audio-inpaint régénère une fenêtre [mask_start, mask_end] d’un clip existant tout en conservant le reste. · Autorisé: text-to-audio, audio-to-audio, audio-inpaint
output_formatenumnon"mp3"Format de fichier média de sortie (mp3, wav, mp4, png, jpg, etc., selon le point d’arrivée). · Autorisé: mp3, wav
durationNombrenon190Quelques secondes. Jusqu’à 3 minutes 10 secondes. · Plage: 1 – 190
stepsNombrenon8Étapes de diffusion. Le modèle turbo 2,5 est réglé pour des niveaux très faibles. · Répartition: 4 – 8
cfg_scaleNombrenon1Guidance sans classificateurs. Le modèle turbo utilise par défaut un petit CFG. · Répartition: 1 – 25
strengthNombrenon0.5Audio-à-audio uniquement. 0,01 = ignorer la référence, 1 = rester proche de la référence. · Portée: 0,01 – 1
mask_startNombrenon-Démarrage de fenêtre en peinture (secondes). Indispensable pour l’audio-inpaint. · Plage: 0 – 190
mask_endNombrenon-Fin de fenêtre d’intérieur (secondes). Indispensable pour l’audio-inpaint. · Plage: 0 – 190
random_seedBooléennonVraiSi c’est vrai, utilisez une graine aléatoire à chaque appel.
seedNombrenon-Graine de reproductibilité. Utilisé uniquement lorsque random_seed = faux.
audio_urlCordenon-Consultez l’URL audio pour audio-to-audio / inpaint.

Notes

Ajoute le mode audio-inpaint (régénération d’une fenêtre temporelle) au-dessus de Stable Audio 2.0.

Exigences de mode

  • Audio-à-audio et audio-inpaint nécessitent tous deux à la fois une invite et un fichier audio téléchargé
  • L’audio-à-audio utilise l’audio de référence pour style/conditioning, PAS pour le clonage vocal

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/stable-audio-2-5.