Stable Audio 2.5

Stability AI · Audio Generation

POST /v1/audio/generations

الصوت to-3-minute النص مع text-to-audio وaudio-to-audio وطلاء صوتي لإنتاج الموسيقى، تصميم الصوت، وإعادة المزج.

في لمحة

الميدان	القيمة
النموذج	`stable-audio-2-5`
تاريخ الإفراج النموذجي	2025-09-10
طرائق المدخلات	النص
طرائق النواتج	Audio
نافذة السياق	-
دقة الوزن	-
المعالم	music_generation، text_to_audio، sound_effects
Native inference	لا
جديدة	لا
نقاط النهاية المدعومة	`POST /v1/audio/generations`

الطباعة

الرسم	Spec	المعدل
التوليد	لكل جيل	$0.68

طلب مثال

$ curl https://api.empiriolabs.ai/v1/audio/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "stable-audio-2-5", "prompt": "warm jazz piano", "duration": 8}'

البارامترات

البارامترات	النوع	المطلوبة	التقصير	الوصف
`prompt`	سلسلة	نعم	-	ماذا يولد
`mode`	enum	لا	`"text-to-audio"`	يعيد audio-inpaint إنشاء نافذة [mask_start، mask_end] لمقطع موجود مع الاحتفاظ بالباقي. · مسموح به: `text-to-audio`، `audio-to-audio`، `audio-inpaint`
`output_format`	enum	لا	`"mp3"`	تنسيق ملف وسائط الإخراج (mp3، wav، mp4، png، jpg، إلخ، حسب نقطة النهاية). · مسموح: `mp3`، `wav`
`duration`	العدد	لا	`190`	ثواني حتى 3 دقائق 10 ثواني الرنج: 1 - 190
`steps`	العدد	لا	`8`	خطوات الشدة ونموذج توربو الـ 2.5 مصمم على أساس درجات منخفضة جدا. الرنج: 4-8
`cfg_scale`	العدد	لا	`1`	إرشادات مجانية يستعمل نموذج توربو الديوكسينات الصغيرة بالفشل الرنج: 1 - 25
`strength`	العدد	لا	`0.5`	(أوديو) فقط 0.01 = تجاهل الإشارة، 1 = البقاء على مقربة من الإشارة. الرنج: 0.01 - 1
`mask_start`	العدد	لا	-	تبدأ النافذة الداخلية (الثانيات). مطلوب للصوت الرنج: صفر - 190
`mask_end`	العدد	لا	-	النوافذ الداخلية (الثانيات). مطلوب للصوت الرنج: صفر - 190
`random_seed`	boolean	لا	صحيح	إذا كان صحيحا، استخدام البذور عشوائي كل مكالمة.
`seed`	العدد	لا	-	بذور التكاثر فقط إستعمل عندما عشوائي
`audio_url`	سلسلة	لا	-	Reference audio URL for audio-to-audio / inpaint.

الحواشي

إضافات**وَصْلَة* ** نمط (تجديد نافذة زمنية) على قمة سيبل أوديو 2.0.

** الاحتياجات من الأموال**

السمع والصوت يتطلّب كلاهما ملفاً صوتياً سريعاً ومحمّلاً
يستخدم الصوت إلى الصوت الصوت المرجعي style/conditioning، وليس لاستنساخ الصوت

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-5.