Stable Audio 2.5

Stable Audio 2.5
Stability AI · Audio Generation
POST /v1/audio/generations

الصوت to-3-minute النص مع text-to-audio وaudio-to-audio وطلاء صوتي لإنتاج الموسيقى، تصميم الصوت، وإعادة المزج.

في لمحة

الميدانالقيمة
النموذجstable-audio-2-5
تاريخ الإفراج النموذجي2025-09-10
طرائق المدخلاتالنص
طرائق النواتجAudio
نافذة السياق-
دقة الوزن-
المعالمmusic_generation، text_to_audio، sound_effects
Native inferenceلا
جديدةلا
نقاط النهاية المدعومةPOST /v1/audio/generations

الطباعة

الرسمSpecالمعدل
التوليدلكل جيل$0.68

طلب مثال

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "stable-audio-2-5", "prompt": "warm jazz piano", "duration": 8}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
promptسلسلةنعم-ماذا يولد
modeenumلا"text-to-audio"يعيد audio-inpaint إنشاء نافذة [mask_start، mask_end] لمقطع موجود مع الاحتفاظ بالباقي. · مسموح به: text-to-audio، audio-to-audio، audio-inpaint
output_formatenumلا"mp3"تنسيق ملف وسائط الإخراج (mp3، wav، mp4، png، jpg، إلخ، حسب نقطة النهاية). · مسموح: mp3، wav
durationالعددلا190ثواني حتى 3 دقائق 10 ثواني الرنج: 1 - 190
stepsالعددلا8خطوات الشدة ونموذج توربو الـ 2.5 مصمم على أساس درجات منخفضة جدا. الرنج: 4-8
cfg_scaleالعددلا1إرشادات مجانية يستعمل نموذج توربو الديوكسينات الصغيرة بالفشل الرنج: 1 - 25
strengthالعددلا0.5(أوديو) فقط 0.01 = تجاهل الإشارة، 1 = البقاء على مقربة من الإشارة. الرنج: 0.01 - 1
mask_startالعددلا-تبدأ النافذة الداخلية (الثانيات). مطلوب للصوت الرنج: صفر - 190
mask_endالعددلا-النوافذ الداخلية (الثانيات). مطلوب للصوت الرنج: صفر - 190
random_seedbooleanلاصحيحإذا كان صحيحا، استخدام البذور عشوائي كل مكالمة.
seedالعددلا-بذور التكاثر فقط إستعمل عندما عشوائي
audio_urlسلسلةلا-Reference audio URL for audio-to-audio / inpaint.

الحواشي

إضافات**وَصْلَة* ** نمط (تجديد نافذة زمنية) على قمة سيبل أوديو 2.0.

** الاحتياجات من الأموال**

  • السمع والصوت يتطلّب كلاهما ملفاً صوتياً سريعاً ومحمّلاً
  • يستخدم الصوت إلى الصوت الصوت المرجعي style/conditioning، وليس لاستنساخ الصوت

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/stable-audio-2-5.