GLM 4.5 Flash | EmpirioLabs AI Docs

Z.ai · Text Generation

POST /v1/chat/completions

तर्क, कोडिंग, लंबी-फ़ॉर्म चैट और सामान्य भाषा कार्यों के लिए मुफ्त हल्का GLM-4.5 टेक्स्ट मॉडल।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`glm-4-5-flash`
मॉडल रिलीज की तारीख	2025-07-28
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	200 हजार
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	98,304
क्षेत्र	सिंगापुर
सुविधाऐं	रीजनिंग, function_calling, structured_output, web_search
मूल अनुमान	नहीं
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	नि: शुल्क
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	नि: शुल्क
अंतर्निहित कैश पढ़ा गया	प्रति 1M कैश्ड इनपुट टोकन	नि: शुल्क
वेब खोज	सक्षम होने पर प्रति अनुरोध	$0.033

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "glm-4-5-flash", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.6`	नमूना तापमान। कम मान अधिक नियतात्मक होते हैं। GLM-4.7-Flash र GLM-4.6V-Flash डिफॉल्टमा 1.0; GLM-4.5-फ्लैश डिफ़ॉल्ट रूप से 0.6 है। · रेंज: 0 - 1
`top_p`	संख्या	नहीं	`0.95`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। Z.AI GLM-4.7, GLM-4.6 और GLM-4.5 श्रृंखला के लिए 0.95 डिफ़ॉल्ट दस्तावेज़ करता है। · रेंज: 0.01 - 1
`max_tokens`	संख्या	नहीं	`4096`	GLM-4.5-फ्लैश के लिए अधिकतम आउटपुट टोकन: 98304। · रेंज: 1 - 98304
`stop`	सरणी	नहीं	-	शब्द सूची रोकें। Z.AI वर्तमान में सरणी रूप में एक स्टॉप स्ट्रिंग का समर्थन करता है।
`do_sample`	बूलियन	नहीं	सच	नमूनाकरण सक्षम करें। गलत होने पर, तापमान और top_p पीढ़ी को प्रभावित नहीं करते हैं।
`enable_thinking`	बूलियन	नहीं	सच	सोच मोड Z.AI नियंत्रित करता है। सक्षम डिफ़ॉल्ट है; GLM-4.5-Flash स्वचालित रूपमा निर्णय लिन्छ कि सक्षम हुँदा सोच्नु छ वा छैन।
`thinking`	वस्तु	नहीं	-	उन्नत सोच वस्तु। {“type”:“enabled”} या {“type”:“disabled”} का उपयोग करें। GLM-4.5-Flash स्वचालित रूपमा निर्णय लिन्छ कि सक्षम हुँदा सोच्नु छ वा छैन।
`response_format`	वस्तु	नहीं	-	JSON मोड के लिए {“type”:“json_object”} या सादे टेक्स्ट के लिए {“type”:“text”} सेट करें।
`tools`	सरणी	नहीं	-	फ़ंक्शन टूल और बिल्ट-इन web_search टूल समर्थित हैं।
`tool_choice`	एनम	नहीं	`"auto"`	नियंत्रित करता है कि मॉडल टूल का उपयोग कर सकता है या नहीं। Z.AI दस्तावेज़ ऑटो टूल चयन; टूल का उपयोग अक्षम करने के लिए टूल को छोड़ दें। · अनुमति: `auto`
`tool_web_search`	बूलियन	नहीं	गलत	अंतर्निहित वेब खोज सक्षम करें। सक्षम होने पर प्रति अनुरोध $0.033 जोड़ता है।
`search_result`	बूलियन	नहीं	सच	वेब खोज सक्षम होने पर संरचित वेब खोज परिणाम मेटाडेटा लौटाएँ.
`search_prompt`	तार	नहीं	-	पुनर्प्राप्त वेब खोज परिणामों को सारांशित करने के लिए वैकल्पिक निर्देश।
`count`	संख्या	नहीं	`10`	पुनर्प्राप्त करने के लिए वेब खोज परिणामों की संख्या। · रेंज: 1 - 50
`search_domain_filter`	तार	नहीं	-	वेब खोज परिणामों के लिए वैकल्पिक डोमेन श्वेतसूची.
`search_recency_filter`	एनम	नहीं	`"noLimit"`	वैकल्पिक वेब खोज रीसेंसी विंडो। · अनुमति: `oneDay`, `oneWeek`, `oneMonth`, `oneYear`, `noLimit`

बेस टोकन का उपयोग निःशुल्क है। अंतर्निहित वेब खोज tool_web_search के माध्यम से वैकल्पिक है और सक्षम होने पर प्रति अनुरोध $0.033 जोड़ती है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/glm-4-5-flash।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ