GLM 4.6V Flash

Z.ai · Text Generation
POST /v1/chat/completionsमूल फ़ंक्शन कॉलिंग के साथ छवि, वीडियो, फ़ाइल और पाठ समझ के लिए मुफ्त मल्टीमॉडल GLM-4.6V मॉडल।
एक नजर में
| फ़ील्ड | मूल्य |
|---|---|
| मॉडल आईडी | glm-4-6v-flash |
| मॉडल रिलीज की तारीख | 2025-12-08 |
| इनपुट तौर-तरीके | पाठ, छवि, वीडियो, फ़ाइल |
| आउटपुट के तौर-तरीके | टेक्स्ट |
| संदर्भ विंडो | 128 हजार |
| वजन परिशुद्धता | - |
| अधिकतम आउटपुट टोकन | 32,768 |
| क्षेत्र | सिंगापुर |
| सुविधाऐं | दृष्टि, video_understanding, document_understanding, function_calling, structured_output, web_search |
| मूल अनुमान | नहीं |
| नया | हाँ |
| समर्थित समापन बिंदु | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
मूल्य निर्धारण
| आवेशित करना | युक्ति | दर |
|---|---|---|
| इनपुट | प्रति 1M प्रॉम्प्ट टोकन | नि: शुल्क |
| उत्पादन | प्रति 1M जेनरेट किए गए टोकन | नि: शुल्क |
| अंतर्निहित कैश पढ़ा गया | प्रति 1M कैश्ड इनपुट टोकन | नि: शुल्क |
| वेब खोज | सक्षम होने पर प्रति अनुरोध | $0.033 |
उदाहरण अनुरोध
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "glm-4-6v-flash", "messages": [{"role":"user","content":"Hello"}]}'
पैरामीटर
| प्राचल | प्रकार | आवश्यक | डिफ़ॉल्ट | या क़िस्म |
|---|---|---|---|---|
temperature | संख्या | नहीं | 1 | नमूना तापमान। कम मान अधिक नियतात्मक होते हैं। GLM-4.7-Flash र GLM-4.6V-Flash डिफॉल्टमा 1.0; GLM-4.5-फ्लैश डिफ़ॉल्ट रूप से 0.6 है। · रेंज: 0 - 1 |
top_p | संख्या | नहीं | 0.95 | नाभिक नमूनाकरण संभाव्यता द्रव्यमान। Z.AI GLM-4.7, GLM-4.6 और GLM-4.5 श्रृंखला के लिए 0.95 डिफ़ॉल्ट दस्तावेज़ करता है। · रेंज: 0.01 - 1 |
max_tokens | संख्या | नहीं | 4096 | GLM-4.6V-Flash के लिए अधिकतम आउटपुट टोकन: 32768। · रेंज: 1 - 32768 |
stop | सरणी | नहीं | - | शब्द सूची रोकें। Z.AI वर्तमान में सरणी रूप में एक स्टॉप स्ट्रिंग का समर्थन करता है। |
do_sample | बूलियन | नहीं | सच | नमूनाकरण सक्षम करें। गलत होने पर, तापमान और top_p पीढ़ी को प्रभावित नहीं करते हैं। |
enable_thinking | बूलियन | नहीं | सच | सोच मोड Z.AI नियंत्रित करता है। सक्षम डिफ़ॉल्ट है; GLM-4.6V-Flash स्वचालित रूपमा निर्णय लिन्छ कि सक्षम हुँदा सोच्नु छ वा छैन। |
thinking | वस्तु | नहीं | - | उन्नत सोच वस्तु। {“type”:“enabled”} या {“type”:“disabled”} का उपयोग करें। GLM-4.6V-Flash स्वचालित रूपमा निर्णय लिन्छ कि सक्षम हुँदा सोच्नु छ वा छैन। |
response_format | वस्तु | नहीं | - | JSON मोड के लिए {“type”:“json_object”} या सादे टेक्स्ट के लिए {“type”:“text”} सेट करें। |
tools | सरणी | नहीं | - | फ़ंक्शन टूल और बिल्ट-इन web_search टूल समर्थित हैं। |
tool_choice | एनम | नहीं | "auto" | नियंत्रित करता है कि मॉडल टूल का उपयोग कर सकता है या नहीं। Z.AI दस्तावेज़ ऑटो टूल चयन; टूल का उपयोग अक्षम करने के लिए टूल को छोड़ दें। · अनुमति: auto |
tool_stream | बूलियन | नहीं | गलत | स्ट्रीम फ़ंक्शन-कॉल टूल आउटपुट जब स्ट्रीम सत्य हो। Z.AI दस्तावेज़ GLM-4.6 और नए मॉडल के लिए tool_stream हैं। |
tool_web_search | बूलियन | नहीं | गलत | अंतर्निहित वेब खोज सक्षम करें। सक्षम होने पर प्रति अनुरोध $0.033 जोड़ता है। |
search_result | बूलियन | नहीं | सच | वेब खोज सक्षम होने पर संरचित वेब खोज परिणाम मेटाडेटा लौटाएँ. |
search_prompt | तार | नहीं | - | पुनर्प्राप्त वेब खोज परिणामों को सारांशित करने के लिए वैकल्पिक निर्देश। |
count | संख्या | नहीं | 10 | पुनर्प्राप्त करने के लिए वेब खोज परिणामों की संख्या। · रेंज: 1 - 50 |
search_domain_filter | तार | नहीं | - | वेब खोज परिणामों के लिए वैकल्पिक डोमेन श्वेतसूची. |
search_recency_filter | एनम | नहीं | "noLimit" | वैकल्पिक वेब खोज रीसेंसी विंडो। · अनुमति: oneDay, oneWeek, oneMonth, oneYear, noLimit |
टिप्पणियाँ
बेस टोकन का उपयोग निःशुल्क है। अंतर्निहित वेब खोज tool_web_search के माध्यम से वैकल्पिक है और सक्षम होने पर प्रति अनुरोध $0.033 जोड़ती है।
Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/glm-4-6v-flash।
