GLM 4.5 Flash

GLM 4.5 Flash
Z.ai · Text Generation
POST /v1/chat/completions

तर्क, कोडिंग, लंबी-फ़ॉर्म चैट और सामान्य भाषा कार्यों के लिए मुफ्त हल्का GLM-4.5 टेक्स्ट मॉडल।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीglm-4-5-flash
मॉडल रिलीज की तारीख2025-07-28
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो200 हजार
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन98,304
क्षेत्रसिंगापुर
सुविधाऐंरीजनिंग, function_calling, structured_output, web_search
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकननि: शुल्क
उत्पादनप्रति 1M जेनरेट किए गए टोकननि: शुल्क
अंतर्निहित कैश पढ़ा गयाप्रति 1M कैश्ड इनपुट टोकननि: शुल्क
वेब खोजसक्षम होने पर प्रति अनुरोध$0.033

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-4-5-flash", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.6नमूना तापमान। कम मान अधिक नियतात्मक होते हैं। GLM-4.7-Flash र GLM-4.6V-Flash डिफॉल्टमा 1.0; GLM-4.5-फ्लैश डिफ़ॉल्ट रूप से 0.6 है। · रेंज: 0 - 1
top_pसंख्यानहीं0.95नाभिक नमूनाकरण संभाव्यता द्रव्यमान। Z.AI GLM-4.7, GLM-4.6 और GLM-4.5 श्रृंखला के लिए 0.95 डिफ़ॉल्ट दस्तावेज़ करता है। · रेंज: 0.01 - 1
max_tokensसंख्यानहीं4096GLM-4.5-फ्लैश के लिए अधिकतम आउटपुट टोकन: 98304। · रेंज: 1 - 98304
stopसरणीनहीं-शब्द सूची रोकें। Z.AI वर्तमान में सरणी रूप में एक स्टॉप स्ट्रिंग का समर्थन करता है।
do_sampleबूलियननहींसचनमूनाकरण सक्षम करें। गलत होने पर, तापमान और top_p पीढ़ी को प्रभावित नहीं करते हैं।
enable_thinkingबूलियननहींसचसोच मोड Z.AI नियंत्रित करता है। सक्षम डिफ़ॉल्ट है; GLM-4.5-Flash स्वचालित रूपमा निर्णय लिन्छ कि सक्षम हुँदा सोच्नु छ वा छैन।
thinkingवस्तुनहीं-उन्नत सोच वस्तु। {“type”:“enabled”} या {“type”:“disabled”} का उपयोग करें। GLM-4.5-Flash स्वचालित रूपमा निर्णय लिन्छ कि सक्षम हुँदा सोच्नु छ वा छैन।
response_formatवस्तुनहीं-JSON मोड के लिए {“type”:“json_object”} या सादे टेक्स्ट के लिए {“type”:“text”} सेट करें।
toolsसरणीनहीं-फ़ंक्शन टूल और बिल्ट-इन web_search टूल समर्थित हैं।
tool_choiceएनमनहीं"auto"नियंत्रित करता है कि मॉडल टूल का उपयोग कर सकता है या नहीं। Z.AI दस्तावेज़ ऑटो टूल चयन; टूल का उपयोग अक्षम करने के लिए टूल को छोड़ दें। · अनुमति: auto
tool_web_searchबूलियननहींगलतअंतर्निहित वेब खोज सक्षम करें। सक्षम होने पर प्रति अनुरोध $0.033 जोड़ता है।
search_resultबूलियननहींसचवेब खोज सक्षम होने पर संरचित वेब खोज परिणाम मेटाडेटा लौटाएँ.
search_promptतारनहीं-पुनर्प्राप्त वेब खोज परिणामों को सारांशित करने के लिए वैकल्पिक निर्देश।
countसंख्यानहीं10पुनर्प्राप्त करने के लिए वेब खोज परिणामों की संख्या। · रेंज: 1 - 50
search_domain_filterतारनहीं-वेब खोज परिणामों के लिए वैकल्पिक डोमेन श्वेतसूची.
search_recency_filterएनमनहीं"noLimit"वैकल्पिक वेब खोज रीसेंसी विंडो। · अनुमति: oneDay, oneWeek, oneMonth, oneYear, noLimit

टिप्पणियाँ

बेस टोकन का उपयोग निःशुल्क है। अंतर्निहित वेब खोज tool_web_search के माध्यम से वैकल्पिक है और सक्षम होने पर प्रति अनुरोध $0.033 जोड़ती है।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/glm-4-5-flash