ACE-Step 1.5 XL

ACE-Step 1.5 XL
ACE-Step · Audio Generation
POST /v1/audio/generations

text-to-song और गीत-निर्देशित ऑडियो के लिए ओपन-सोर्स संगीत निर्माण मॉडल, नियंत्रणीय गीत पुनरावृत्ति के लिए तेज़ 8-चरण XL टर्बो अनुमान के साथ।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीace-step-1.5-xl
मॉडल रिलीज की तारीख2026-04-02
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेऑडियो
संदर्भ विंडो-
वजन परिशुद्धताबीएफ16
सुविधाऐंmusic_generation, गीत, text_to_music, seed_control, commercial_ready
मूल अनुमानहाँ
नयाहाँ
समर्थित समापन बिंदुPOST /v1/audio/generations

मूल्य निर्धारण

आवेशित करनायुक्तिदर
संगीत निर्माणप्रति उत्पन्न सेकंड$0.00025 ($0.0003 था)

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/audio/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "ace-step-1.5-xl", "prompt": "warm jazz piano", "duration": 8}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
promptतारहाँ-शैली, मनोदशा, इंस्ट्रूमेंटेशन और बीपीएम संगीत रचना का वर्णन करने वाले संकेत देते हैं। अल्पविराम से अलग टैग अच्छी तरह से काम करते हैं।
lyricsतारनहीं-ट्रैक के लिए मुखर गीत। अनुभागों को चिह्नित करने के लिए [कविता] / [कोरस] / [पुल] टैग का उपयोग करें, वाद्य ब्रेक के लिए खाली पंक्ति। विशुद्ध रूप से वाद्य पटरियों के लिए खाली छोड़ दें।
audio_durationसंख्यानहीं30.0सेकंड में उत्पन्न ट्रैक की लंबाई। मॉडल ~ 4 मिनट तक सबसे विश्वसनीय है; लंबे समय तक प्रसार के दौरान बूंदों OOM/quality जोखिम होता है। · रेंज: 10.0 - 240
num_inference_stepsपूर्ण संख्‍यानहीं8प्रसार चरणों की संख्या। टर्बो संस्करण के लिए 8 अनुशंसित मीठा स्थान है; अधिक पॉलिश के लिए बढ़ाएं, सस्ते ड्राफ्ट पीढ़ियों के लिए कम। · रेंज: 1 - 20
guidance_scaleसंख्यानहीं1.0क्लासिफायर-मुक्त मार्गदर्शन पैमाने। 1.0 मॉडल के प्राकृतिक वितरण का अनुसरण करता है; उच्च मूल्य विविधता की कीमत पर संकेत के करीब धकेलते हैं। · रेंज: 0.0 - 20.0
shiftसंख्यानहीं-प्रसार टाइमस्टेप शिफ्ट। डिफ़ॉल्ट शेड्यूल को अपरिवर्तित छोड़ देता है; slower/dreamier परिणामों के लिए shorter/punchier के लिए 1.0+ या 1.0 से नीचे 1.0+ पर कुहनी करें।
negative_promptतारनहीं-नकारात्मक संकेत - विरोधी टैग, विरोधी शैलियों, बाहर करने के लिए उपकरणों. प्रॉम्प्ट के रूप में एक ही अल्पविराम से अलग शैली।
seedपूर्ण संख्‍यानहीं-प्रतिलिपि प्रस्तुत करने योग्यता के लिए यादृच्छिक बीज। एक ही बीज + समान पैरा एक ही ट्रैक का उत्पादन करते हैं।
formatएनमनहीं"flac"प्रतिक्रिया के लिए ऑडियो कंटेनर प्रारूप। FLAC = दोषरहित, WAV = असम्पीडित, MP3 = छोटा फ़ाइल आकार। · अनुमति: flac, wav, ogg, mp3
response_formatएनमनहीं"url"कार्यकर्ता ऑडियो कैसे लौटाता है। ‘url’ रेंडर की गई फ़ाइल पर हस्ताक्षरित URL लौटाता है; ‘Base64’ प्रतिक्रिया में बाइट्स को इनलाइन करता है। · अनुमति: url, b64_json
return_base64बूलियननहींगलतसही होने पर, प्रतिक्रिया में URL के अलावा (या इसके बजाय, response_format के आधार पर) आधार 64 के रूप में प्रदान किए गए ऑडियो को शामिल किया जाता है।

टिप्पणियाँ

डिफॉल्ट

  • 8 अनुमान चरण
  • मार्गदर्शन स्केल 1.0
  • दोषरहित FLAC आउटपुट

नियंत्रण

गीत, prompt/description, 10-600 की अवधि, बीज, शिफ्ट, वैकल्पिक नकारात्मक संकेत का समर्थन करता है जब पिन की गई पाइपलाइन द्वारा समर्थित होता है, और URL या base64 आउटपुट मोड।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/ace-step-1.5-xl