Stable Audio 2.0

Stable Audio 2.0
Stability AI · Audio Generation
POST /v1/audio/generations

टेक्स्ट प्रॉम्प्ट से 3 मिनट तक ऑडियो उत्पन्न करता है, समायोज्य अवधि, चरणों और सीएफजी पैमाने के साथ text-to-audio और audio-to-audio का समर्थन करता है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीstable-audio-2-0
मॉडल रिलीज की तारीख2024-04-03
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेऑडियो
संदर्भ विंडो-
वजन परिशुद्धता-
सुविधाऐंmusic_generation, text_to_audio, sound_effects
मूल अनुमाननहीं
नयानहीं
समर्थित समापन बिंदुPOST /v1/audio/generations

मूल्य निर्धारण

आवेशित करनायुक्तिदर
आधार लागतप्रति पीढ़ी$0.58
प्रति कदम लागतप्रति कदम$0.00

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "stable-audio-2-0", "prompt": "warm jazz piano", "duration": 8}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
promptतारहाँ-क्या उत्पन्न करना है। शैली, वाद्ययंत्र, मनोदशा और गति के बारे में विशिष्ट रहें।
modeएनमनहीं"text-to-audio"text-to-audio: केवल प्रॉम्प्ट से जनरेट करें। audio-to-audio: संदर्भ क्लिप पर स्थिति। · अनुमति: text-to-audio, audio-to-audio
output_formatएनमनहीं"mp3"आउटपुट मीडिया फ़ाइल स्वरूप (mp3, wav, mp4, png, jpg, आदि, समापन बिंदु के आधार पर)। · अनुमति: mp3, wav
durationसंख्यानहीं190सेकंड। स्थिरता ऑडियो 2.0 3 मिनट 10 सेकंड तक उत्पन्न करता है। · रेंज: 1 - 190
stepsसंख्यानहीं50प्रसार चरण। अधिक = उच्च निष्ठा, धीमी (और प्रति-चरण क्रेडिट जोड़ता है)। · रेंज: 30 - 100
cfg_scaleसंख्यानहीं7क्लासिफायर-मुक्त मार्गदर्शन। उच्च = संकेत का अधिक सख्ती से पालन करता है। · रेंज: 1 - 25
strengthसंख्यानहीं1केवल ऑडियो-टू-ऑडियो। 0 = संदर्भ पर ध्यान न दें, 1 = संदर्भ के करीब रहें। · रेंज: 0 - 1
random_seedबूलियननहींसचयदि सत्य है, तो प्रत्येक कॉल में एक यादृच्छिक बीज का उपयोग करें।
seedसंख्यानहीं-प्रजनन क्षमता बीज। केवल तभी उपयोग किया जाता है जब random_seed=false।
audio_urlतारनहीं-audio-to-audio मोड के लिए ऑडियो URL का संदर्भ लें.

टिप्पणियाँ

टेक्स्ट से या audio-to-audio परिवर्तन के माध्यम से 3 मिनट तक का ऑडियो उत्पन्न करता है।

ऑडियो-टू-ऑडियो मोड

  • एक संकेत और एक अपलोड की गई ऑडियो फ़ाइल दोनों की आवश्यकता है
  • अनुशंसित सीएफजी स्केल: 7-15
  • अनुशंसित कदम: 6-8
  • विशिष्ट ताकत: 0.3-0.7

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-0