Stable Audio 2.5 | EmpirioLabs AI Docs

Stability AI · Audio Generation

POST /v1/audio/generations

संगीत उत्पादन, ध्वनि डिजाइन और रीमिक्सिंग के लिए text-to-audio, audio-to-audio और ऑडियो इनपेंटिंग के साथ पाठ से अप-to-3-minute ऑडियो।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`stable-audio-2-5`
मॉडल रिलीज की तारीख	2025-09-10
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	ऑडियो
संदर्भ विंडो	-
वजन परिशुद्धता	-
सुविधाऐं	music_generation, text_to_audio, sound_effects
मूल अनुमान	नहीं
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/audio/generations`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
पीढ़ी	प्रति पीढ़ी	$0.68

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/audio/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "stable-audio-2-5", "prompt": "warm jazz piano", "duration": 8}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`prompt`	तार	हाँ	-	क्या उत्पन्न करना है।
`mode`	एनम	नहीं	`"text-to-audio"`	ऑडियो-इनपेंट बाकी को रखते हुए मौजूदा क्लिप की एक [mask_start, mask_end] विंडो को पुन: उत्पन्न करता है। अनुमति: `text-to-audio`, `audio-to-audio`, `audio-inpaint`
`output_format`	एनम	नहीं	`"mp3"`	आउटपुट मीडिया फ़ाइल स्वरूप (mp3, wav, mp4, png, jpg, आदि, समापन बिंदु के आधार पर)। · अनुमति: `mp3`, `wav`
`duration`	संख्या	नहीं	`190`	सेकंड। 3 मिनट 10 सेकंड तक। · रेंज: 1 - 190
`steps`	संख्या	नहीं	`8`	प्रसार चरण। 2.5 टर्बो मॉडल को बहुत कम स्टेप काउंट के लिए ट्यून किया गया है। · रेंज: 4 - 8
`cfg_scale`	संख्या	नहीं	`1`	क्लासिफायर-मुक्त मार्गदर्शन। टर्बो मॉडल डिफ़ॉल्ट रूप से छोटे CFG का उपयोग करता है। · रेंज: 1 - 25
`strength`	संख्या	नहीं	`0.5`	केवल ऑडियो-टू-ऑडियो। 0.01 = संदर्भ पर ध्यान न दें, 1 = संदर्भ के करीब रहें। · रेंज: 0.01 - 1
`mask_start`	संख्या	नहीं	-	इनपेंट विंडो स्टार्ट (सेकंड)। ऑडियो-इनपेंट के लिए आवश्यक। · रेंज: 0 - 190
`mask_end`	संख्या	नहीं	-	इनपेंट विंडो एंड (सेकंड)। ऑडियो-इनपेंट के लिए आवश्यक। · रेंज: 0 - 190
`random_seed`	बूलियन	नहीं	सच	यदि सत्य है, तो प्रत्येक कॉल में एक यादृच्छिक बीज का उपयोग करें।
`seed`	संख्या	नहीं	-	प्रजनन क्षमता बीज। केवल तभी उपयोग किया जाता है जब random_seed=false।
`audio_url`	तार	नहीं	-	audio-to-audio/इनपेंट के लिए संदर्भ ऑडियो यूआरएल।

ऑडियो-टू-ऑडियो और ऑडियो-इनपेंट दोनों के लिए प्रॉम्प्ट और अपलोड की गई ऑडियो फ़ाइल दोनों की आवश्यकता होती है
ऑडियो-टू-ऑडियो style/conditioning के लिए संदर्भ ऑडियो का उपयोग करता है, आवाज क्लोनिंग के लिए नहीं

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-5।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ