Stable Audio 2.0 | EmpirioLabs AI Docs

Stability AI · Audio Generation

POST /v1/audio/generations

टेक्स्ट प्रॉम्प्ट से 3 मिनट तक ऑडियो उत्पन्न करता है, समायोज्य अवधि, चरणों और सीएफजी पैमाने के साथ text-to-audio और audio-to-audio का समर्थन करता है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`stable-audio-2-0`
मॉडल रिलीज की तारीख	2024-04-03
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	ऑडियो
संदर्भ विंडो	-
वजन परिशुद्धता	-
सुविधाऐं	music_generation, text_to_audio, sound_effects
मूल अनुमान	नहीं
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/audio/generations`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
आधार लागत	प्रति पीढ़ी	$0.58
प्रति कदम लागत	प्रति कदम	$0.00

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/audio/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "stable-audio-2-0", "prompt": "warm jazz piano", "duration": 8}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`prompt`	तार	हाँ	-	क्या उत्पन्न करना है। शैली, वाद्ययंत्र, मनोदशा और गति के बारे में विशिष्ट रहें।
`mode`	एनम	नहीं	`"text-to-audio"`	text-to-audio: केवल प्रॉम्प्ट से जनरेट करें। audio-to-audio: संदर्भ क्लिप पर स्थिति। · अनुमति: `text-to-audio`, `audio-to-audio`
`output_format`	एनम	नहीं	`"mp3"`	आउटपुट मीडिया फ़ाइल स्वरूप (mp3, wav, mp4, png, jpg, आदि, समापन बिंदु के आधार पर)। · अनुमति: `mp3`, `wav`
`duration`	संख्या	नहीं	`190`	सेकंड। स्थिरता ऑडियो 2.0 3 मिनट 10 सेकंड तक उत्पन्न करता है। · रेंज: 1 - 190
`steps`	संख्या	नहीं	`50`	प्रसार चरण। अधिक = उच्च निष्ठा, धीमी (और प्रति-चरण क्रेडिट जोड़ता है)। · रेंज: 30 - 100
`cfg_scale`	संख्या	नहीं	`7`	क्लासिफायर-मुक्त मार्गदर्शन। उच्च = संकेत का अधिक सख्ती से पालन करता है। · रेंज: 1 - 25
`strength`	संख्या	नहीं	`1`	केवल ऑडियो-टू-ऑडियो। 0 = संदर्भ पर ध्यान न दें, 1 = संदर्भ के करीब रहें। · रेंज: 0 - 1
`random_seed`	बूलियन	नहीं	सच	यदि सत्य है, तो प्रत्येक कॉल में एक यादृच्छिक बीज का उपयोग करें।
`seed`	संख्या	नहीं	-	प्रजनन क्षमता बीज। केवल तभी उपयोग किया जाता है जब random_seed=false।
`audio_url`	तार	नहीं	-	audio-to-audio मोड के लिए ऑडियो URL का संदर्भ लें.

एक संकेत और एक अपलोड की गई ऑडियो फ़ाइल दोनों की आवश्यकता है
अनुशंसित सीएफजी स्केल: 7-15
अनुशंसित कदम: 6-8
विशिष्ट ताकत: 0.3-0.7

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-0।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ