ACE-Step 1.5 XL

ACE-Step 1.5 XL
ACE-Step · Audio Generation
POST /v1/audio/generations

نموذج لتوليد الموسيقى من مصادر مفتوحة لـ text-to-song وصوت مسموع ذي توجيه حراري، مع إشارة سريعة من طراز XL توربو لالتقاط أغنية قابلة للمراقبة.

في لمحة

الميدانالقيمة
النموذجace-step-1.5-xl
تاريخ الإفراج النموذجي2026-04-02
طرائق المدخلاتالنص
طرائق النواتجAudio
نافذة السياق-
دقة الوزنBF16
المعالمmusic_generation، الكلمات، text_to_music، seed_control، commercial_ready
Native inferenceنعم
جديدةنعم
نقاط النهاية المدعومةPOST /v1/audio/generations

الطباعة

الرسمSpecالمعدل
جيل الموسيقىالثاني المولد$0.00025 (كان $0.0003)

طلب مثال

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "ace-step-1.5-xl", "prompt": "warm jazz piano", "duration": 8}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
promptسلسلةنعم-نوع، مزاج، أداة، وتلميح BPM يصف الموسيقى لصورة. العلامات المنفصلة عن البيانات تعمل بشكل جيد
lyricsسلسلةلا-كلمات صوتية للمسار استعملي علامة (العكس) / / / / / / / / / / / / / علامه لعلامه اجزاء, خط فارغ لكسر اكتس إتركْ فارغاً لمساراتِ الأدواتِ البحتةِ.
audio_durationالعددلا30.0طول المسار المولد في ثواني The model is most reliable up to ~4 minutes; longer durations risk OOM/quality drops during diffusion. الرنج: 10.0 - 240
num_inference_stepsintegerلا8عدد خطوات الانتشار)٨(هي البقعة الحلوة الموصى بها لبديل توربو؛ والارتفاع من أجل المزيد من التلميع، والأقل من ذلك لأجيال أرخص. الرنج: 1 - 20
guidance_scaleالعددلا1.0جدول توجيهي خال من التصنيف. 1.0 تتبع التوزيع الطبيعي للنموذج.. القيم الأعلى تقترب من السرعة بكلفة التنوع الرنج: 0.0 - 20.0
shiftالعددلا-التحول عبر الزمن Default leaves the schedule changed; nudge to 1.0+ for shorter/punchier or below 1.0 for slower/dreamier results.
negative_promptسلسلةلا-باطراد سلبي - مضادات، أدوات للاستبعاد. نفس الأسلوب المنفصل كسرعة
seedintegerلا-البذور النادرة لإعادة الإنتاج. نفس البذور + المواصفات المتطابقة تنتج نفس المسار
formatenumلا"flac"صيغة حاوية صوتية للرد. FLAC = بدون فقدان، WAV = غير مضغوط، MP3 = حجم ملف صغير. · مسموح ب: flac، wav، ogg، mp3
response_formatenumلا"url"كيف يعيد العامل الصوت. ‘url’ يعيد عنوان URL موقع إلى الملف المعروض؛ ‘base64’ يدمج البايتات في الرد. · مسموح: url، b64_json
return_base64booleanلاكاذبوإذا كان الرد صحيحاً، فإنه يشمل الصوت المسموع بوصفه القاعدة 64 بالإضافة إلى (أو بدلاً من ذلك، اعتماداً على الرد - format) الـ (URL).

الحواشي

** المتأخرات**

  • 8 خطوات مرجعية
  • الجدول الإرشادي
  • ناتج القوات المسلحة الليبرية المفقودة

** مراقبون**

Supports lyrics, prompt/description, 10-600s duration, seed, shift, optional negative prompt when supported by the binned pipeline, and URL or base64 output mode.


مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/ace-step-1.5-xl.