ACE-Step 1.5 XL | EmpirioLabs AI Docs

ACE-Step · Audio Generation

POST /v1/audio/generations

text-to-song और गीत-निर्देशित ऑडियो के लिए ओपन-सोर्स संगीत निर्माण मॉडल, नियंत्रणीय गीत पुनरावृत्ति के लिए तेज़ 8-चरण XL टर्बो अनुमान के साथ।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`ace-step-1.5-xl`
मॉडल रिलीज की तारीख	2026-04-02
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	ऑडियो
संदर्भ विंडो	-
वजन परिशुद्धता	बीएफ16
सुविधाऐं	music_generation, गीत, text_to_music, seed_control, commercial_ready
मूल अनुमान	हाँ
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/audio/generations`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
संगीत निर्माण	प्रति उत्पन्न सेकंड	$0.00025 ($0.0003 था)

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/audio/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "ace-step-1.5-xl", "prompt": "warm jazz piano", "duration": 8}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`prompt`	तार	हाँ	-	शैली, मनोदशा, इंस्ट्रूमेंटेशन और बीपीएम संगीत रचना का वर्णन करने वाले संकेत देते हैं। अल्पविराम से अलग टैग अच्छी तरह से काम करते हैं।
`lyrics`	तार	नहीं	-	ट्रैक के लिए मुखर गीत। अनुभागों को चिह्नित करने के लिए [कविता] / [कोरस] / [पुल] टैग का उपयोग करें, वाद्य ब्रेक के लिए खाली पंक्ति। विशुद्ध रूप से वाद्य पटरियों के लिए खाली छोड़ दें।
`audio_duration`	संख्या	नहीं	`30.0`	सेकंड में उत्पन्न ट्रैक की लंबाई। मॉडल ~ 4 मिनट तक सबसे विश्वसनीय है; लंबे समय तक प्रसार के दौरान बूंदों OOM/quality जोखिम होता है। · रेंज: 10.0 - 240
`num_inference_steps`	पूर्ण संख्‍या	नहीं	`8`	प्रसार चरणों की संख्या। टर्बो संस्करण के लिए 8 अनुशंसित मीठा स्थान है; अधिक पॉलिश के लिए बढ़ाएं, सस्ते ड्राफ्ट पीढ़ियों के लिए कम। · रेंज: 1 - 20
`guidance_scale`	संख्या	नहीं	`1.0`	क्लासिफायर-मुक्त मार्गदर्शन पैमाने। 1.0 मॉडल के प्राकृतिक वितरण का अनुसरण करता है; उच्च मूल्य विविधता की कीमत पर संकेत के करीब धकेलते हैं। · रेंज: 0.0 - 20.0
`shift`	संख्या	नहीं	-	प्रसार टाइमस्टेप शिफ्ट। डिफ़ॉल्ट शेड्यूल को अपरिवर्तित छोड़ देता है; slower/dreamier परिणामों के लिए shorter/punchier के लिए 1.0+ या 1.0 से नीचे 1.0+ पर कुहनी करें।
`negative_prompt`	तार	नहीं	-	नकारात्मक संकेत - विरोधी टैग, विरोधी शैलियों, बाहर करने के लिए उपकरणों. प्रॉम्प्ट के रूप में एक ही अल्पविराम से अलग शैली।
`seed`	पूर्ण संख्‍या	नहीं	-	प्रतिलिपि प्रस्तुत करने योग्यता के लिए यादृच्छिक बीज। एक ही बीज + समान पैरा एक ही ट्रैक का उत्पादन करते हैं।
`format`	एनम	नहीं	`"flac"`	प्रतिक्रिया के लिए ऑडियो कंटेनर प्रारूप। FLAC = दोषरहित, WAV = असम्पीडित, MP3 = छोटा फ़ाइल आकार। · अनुमति: `flac`, `wav`, `ogg`, `mp3`
`response_format`	एनम	नहीं	`"url"`	कार्यकर्ता ऑडियो कैसे लौटाता है। ‘url’ रेंडर की गई फ़ाइल पर हस्ताक्षरित URL लौटाता है; ‘Base64’ प्रतिक्रिया में बाइट्स को इनलाइन करता है। · अनुमति: `url`, `b64_json`
`return_base64`	बूलियन	नहीं	गलत	सही होने पर, प्रतिक्रिया में URL के अलावा (या इसके बजाय, response_format के आधार पर) आधार 64 के रूप में प्रदान किए गए ऑडियो को शामिल किया जाता है।

गीत, prompt/description, 10-600 की अवधि, बीज, शिफ्ट, वैकल्पिक नकारात्मक संकेत का समर्थन करता है जब पिन की गई पाइपलाइन द्वारा समर्थित होता है, और URL या base64 आउटपुट मोड।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/ace-step-1.5-xl।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ