GLM 5.2

GLM 5.2
Z.ai · Text Generation
/v1/chat/completions

1M टोकन संदर्भ, 128K आउटपुट, समायोज्य तर्क प्रयास, मूल वेब खोज और टूल कॉलिंग के साथ रीजनिंग और कोडिंग मॉडल।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीglm-5-2
मॉडल रिलीज की तारीख2026-06-16
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन131,072
क्षेत्रसिंगापुर
सुविधाऐंरीजनिंग, function_calling, structured_output, web_search
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदु/v1/chat/completions, /v1/responses, /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$1.40
उत्पादनप्रति 1M जेनरेट किए गए टोकन$4.40
वेब खोजप्रति अनुरोध$0.033

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-5-2", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
max_tokensपूर्ण संख्‍यानहीं65536उत्पन्न करने के लिए आउटपुट टोकन की अधिकतम संख्या। · रेंज: 1 - 131072
temperatureसंख्यानहीं1यादृच्छिकता को नियंत्रित करता है। कम मान प्रतिक्रियाओं को अधिक नियतात्मक बनाते हैं। · रेंज: 0 - 1
top_pसंख्यानहीं0.95न्यूक्लियस सैंपलिंग कटऑफ। · रेंज: 0.01 - 1
reasoning_effortएनमनहीं"max"GLM-5.2 तर्क प्रयास। कोई भी सोच को अक्षम नहीं करता है; अधिकतम के माध्यम से न्यूनतम सेट करें कि जवाब देने से पहले मॉडल कितना कठिन कारण है। जटिल कोडिंग के लिए अधिकतम की सिफारिश की जाती है। · अनुमति: none, minimal, low, medium, high, xhigh, max
enable_thinkingबूलियननहींसचजवाब देने से पहले मॉडल को तर्क करने दें। सबसे कम-विलंबता उत्तरों या सख्त संरचित आउटपुट के लिए बंद करें।
do_sampleबूलियननहींसचनमूनाकरण सक्षम करें। लालची नियतात्मक आउटपुट के लिए बंद करें (तापमान और top_p को नजरअंदाज कर दिया जाता है)।
tool_web_searchबूलियननहींगलतअंतर्निहित वेब खोज सक्षम करें। उपयोग किए जाने पर प्रति अनुरोध $0.033 जोड़ता है।
search_recency_filterएनमनहीं"noLimit"वेब खोज परिणामों को एक रीसेंसी विंडो तक सीमित करें। · अनुमति: oneDay, oneWeek, oneMonth, oneYear, noLimit
countपूर्ण संख्‍यानहीं10वेब खोज सक्षम होने पर पुनर्प्राप्त करने के लिए वेब खोज परिणामों की संख्या. · रेंज: 1 - 50
search_domain_filterतारनहीं-वेब खोज को किसी विशिष्ट डोमेन तक सीमित करें.
search_promptतारनहीं-पुनर्प्राप्त किए गए वेब खोज परिणामों को सारांशित करने के लिए वैकल्पिक संकेत का उपयोग किया जाता है।
search_resultबूलियननहींसचवेब खोज सक्षम होने पर प्रतिक्रिया में वेब खोज परिणाम मेटाडेटा लौटाएं.
tool_streamबूलियननहींगलतस्ट्रीमिंग करते समय फ़ंक्शन-कॉल तर्कों को वृद्धिशील रूप से स्ट्रीम करें।
toolsसरणीनहीं[]OpenAI-संगत फ़ंक्शन कॉलिंग टूल परिभाषाएँ।
tool_choiceवस्तुनहीं-OpenAI-संगत उपकरण विकल्प नियंत्रण।
response_formatवस्तुनहीं-OpenAI-संगत JSON मोड। सख्त संरचित आउटपुट के लिए सोच अक्षम का उपयोग करें।
stopसरणीनहीं-वैकल्पिक स्टॉप अनुक्रम (4 तक)।

विकल्प

:variant1

फ़ील्डमूल्य
मॉडल आईडीglm-5-2:variant1
मॉडल रिलीज की तारीख2026-06-16
क्षेत्रजर्मनी
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन131,072
सुविधाऐंरीजनिंग, function_calling, structured_output, कैश
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$1.10 ($1.40 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन$3.851 ($4.40 था)
अंतर्निहित कैश पढ़ा गयाप्रति 1M कैश्ड इनपुट टोकन$0.275

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 131072
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले step-by-step तर्क सक्षम करें।
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
thinking_budgetसंख्यानहीं32768रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 131072 तक। · रेंज: 1 - 131072

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/glm-5-2