temperature | संख्या | नहीं | 1.0 | नमूना तापमान। कम मान अधिक नियतात्मक होते हैं। · रेंज: 0 - 2 |
top_p | संख्या | नहीं | 0.95 | नाभिक नमूनाकरण संभाव्यता द्रव्यमान। · रेंज: 0 - 1 |
max_tokens | पूर्ण संख्या | नहीं | 4096 | अधिकतम आउटपुट टोकन। · रेंज: 1 - 32768 |
stop | तार | नहीं | - | एक या अधिक स्टॉप स्ट्रिंग्स। |
reasoning_effort | एनम | नहीं | "medium" | तर्क प्रयास। कोई भी सोच को अक्षम नहीं करता है; निम्न, मध्यम, उच्च और अधिकतम सेट बाध्य सोच बजट। · अनुमति: none, low, medium, high, max |
enable_thinking | बूलियन | नहीं | सच | अंतिम आउटपुट से पहले मॉडल रीजनिंग चैनल को सक्षम करें। |
thinking_budget | पूर्ण संख्या | नहीं | 4096 | अंतिम उत्तर से पहले अधिकतम सोच टोकन। यदि max_tokens कम है, तो सेवा उत्तर के लिए जगह आरक्षित करती है। · रेंज: 128 - 32768 |
top_k | पूर्ण संख्या | नहीं | 20 | समर्थित होने पर नमूनाकरण को शीर्ष K उम्मीदवार टोकन तक सीमित करें। · रेंज: 1 - 200 |
min_p | संख्या | नहीं | 0 | टोकन नमूने के लिए न्यूनतम संभावना सीमा। · रेंज: 0 - 1 |
presence_penalty | संख्या | नहीं | 0 | टोकन के लिए जुर्माना जो पहले से ही जेनरेट किए गए टेक्स्ट में दिखाई दे रहे हैं। · रेंज: -2 - 2 |
frequency_penalty | संख्या | नहीं | 0 | टोकन कितनी बार पहले ही दिखाई दे चुका है, इसके आधार पर जुर्माना। · रेंज: -2 - 2 |
repetition_penalty | संख्या | नहीं | 1 | बार-बार पाठ को कम करने के लिए SGLang द्वारा उपयोग किया जाने वाला जुर्माना। · रेंज: 0.1 - 2 |
seed | पूर्ण संख्या | नहीं | - | प्रतिलिपि प्रस्तुत करने योग्य नमूने के लिए वैकल्पिक यादृच्छिक बीज। · रेंज: 0 - 2147483647 |
logprobs | बूलियन | नहीं | गलत | समर्थित होने पर टोकन लॉग संभावनाएँ लौटाएँ। |
top_logprobs | पूर्ण संख्या | नहीं | - | इस कई शीर्ष टोकन लॉग संभावनाओं तक लौटें। · रेंज: 0 - 20 |
logit_bias | वस्तु | नहीं | - | नमूना लेने से पहले सकारात्मक या नकारात्मक मान जोड़कर पूर्वाग्रह टोकन आईडी। |
tools | सरणी | नहीं | - | OpenAI-संगत फ़ंक्शन टूल परिभाषाएँ। |
tool_choice | वस्तु | नहीं | - | OpenAI-संगत फ़ंक्शन टूल चयन। |
response_format | वस्तु | नहीं | - | संरचित JSON आउटपुट निर्देश। |
stream | बूलियन | नहीं | गलत | सर्वर द्वारा भेजे गए ईवेंट का उपयोग करके प्रतिक्रिया डेल्टा स्ट्रीम करें। |
web_search_linkup | बूलियन | नहीं | गलत | लिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम। |
disable_formatting | बूलियन | नहीं | गलत | सक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है। |