prompt | तार | हाँ | - | शैली, मनोदशा, इंस्ट्रूमेंटेशन और बीपीएम संगीत रचना का वर्णन करने वाले संकेत देते हैं। अल्पविराम से अलग टैग अच्छी तरह से काम करते हैं। |
lyrics | तार | नहीं | - | ट्रैक के लिए मुखर गीत। अनुभागों को चिह्नित करने के लिए [कविता] / [कोरस] / [पुल] टैग का उपयोग करें, वाद्य ब्रेक के लिए खाली पंक्ति। विशुद्ध रूप से वाद्य पटरियों के लिए खाली छोड़ दें। |
audio_duration | संख्या | नहीं | 30.0 | सेकंड में उत्पन्न ट्रैक की लंबाई। मॉडल ~ 4 मिनट तक सबसे विश्वसनीय है; लंबे समय तक प्रसार के दौरान बूंदों OOM/quality जोखिम होता है। · रेंज: 10.0 - 240 |
num_inference_steps | पूर्ण संख्या | नहीं | 8 | प्रसार चरणों की संख्या। टर्बो संस्करण के लिए 8 अनुशंसित मीठा स्थान है; अधिक पॉलिश के लिए बढ़ाएं, सस्ते ड्राफ्ट पीढ़ियों के लिए कम। · रेंज: 1 - 20 |
guidance_scale | संख्या | नहीं | 1.0 | क्लासिफायर-मुक्त मार्गदर्शन पैमाने। 1.0 मॉडल के प्राकृतिक वितरण का अनुसरण करता है; उच्च मूल्य विविधता की कीमत पर संकेत के करीब धकेलते हैं। · रेंज: 0.0 - 20.0 |
shift | संख्या | नहीं | - | प्रसार टाइमस्टेप शिफ्ट। डिफ़ॉल्ट शेड्यूल को अपरिवर्तित छोड़ देता है; slower/dreamier परिणामों के लिए shorter/punchier के लिए 1.0+ या 1.0 से नीचे 1.0+ पर कुहनी करें। |
negative_prompt | तार | नहीं | - | नकारात्मक संकेत - विरोधी टैग, विरोधी शैलियों, बाहर करने के लिए उपकरणों. प्रॉम्प्ट के रूप में एक ही अल्पविराम से अलग शैली। |
seed | पूर्ण संख्या | नहीं | - | प्रतिलिपि प्रस्तुत करने योग्यता के लिए यादृच्छिक बीज। एक ही बीज + समान पैरा एक ही ट्रैक का उत्पादन करते हैं। |
format | एनम | नहीं | "flac" | प्रतिक्रिया के लिए ऑडियो कंटेनर प्रारूप। FLAC = दोषरहित, WAV = असम्पीडित, MP3 = छोटा फ़ाइल आकार। · अनुमति: flac, wav, ogg, mp3 |
response_format | एनम | नहीं | "url" | कार्यकर्ता ऑडियो कैसे लौटाता है। ‘url’ रेंडर की गई फ़ाइल पर हस्ताक्षरित URL लौटाता है; ‘Base64’ प्रतिक्रिया में बाइट्स को इनलाइन करता है। · अनुमति: url, b64_json |
return_base64 | बूलियन | नहीं | गलत | सही होने पर, प्रतिक्रिया में URL के अलावा (या इसके बजाय, response_format के आधार पर) आधार 64 के रूप में प्रदान किए गए ऑडियो को शामिल किया जाता है। |