Stable Audio 2.0

Stability AI · Audio Generation
POST /v1/audio/generationsErzeugt Audio bis zu 3 Minuten aus Textprompts und unterstützt text-to-audio und audio-to-audio mit einstellbarer Dauer, Schritten und CFG-Skala.
Auf einen Blick
Preisgestaltung
Beispielanfrage
Parameter
Anmerkungen
Erzeugt bis zu 3 Minuten Audio aus Text oder durch audio-to-audio Transformation.
Audio-zu-Audio-Modus
- Erfordert SOWOHL eine Eingabeaufforderung als auch eine hochgeladene Audiodatei
- Empfohlene CFG-Skala: 7-15
- Empfohlene Schritte: 6-8
- Typische Stärke: 0,3–0,7
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-0.
