Qwen3.7 Max

Qwen3.7 Max
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Qwen3.7 Max कोडिंग, उत्पादकता, लंबे समय तक चलने वाले एजेंटों, गहरी सोच, उपकरण और 1M-टोकन संदर्भ के लिए एक प्रमुख टेक्स्ट मॉडल है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीqwen3-7-max
मॉडल रिलीज की तारीख2026-05-21
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन65,536
क्षेत्रसिंगापुर
सुविधाऐंरीजनिंग, web_search, code_interpreter, function_calling, agentic_coding
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$2.50
उत्पादनप्रति 1M जेनरेट किए गए टोकन$7.50
वेब खोजप्रति कॉल जब लागू किया जाता है$0.02
वेब चिमटाप्रति कॉल जब लागू किया जाता है$0.02
कोड दुभाषियाप्रति कॉल जब लागू किया जाता है$0.02

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले तर्क सक्षम करें।
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। · अनुमति: none, low, medium, high, max
thinking_budgetसंख्यानहीं32768सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 64000
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.02 जोड़ता है.
tool_web_extractorबूलियननहींगलतURL से सामग्री निकालें और पढ़ें। वेब खोज और सोच की आवश्यकता है। प्रत्येक आह्वान किए गए वेब चिमटा कॉल के लिए अनुरोध लागत में $0.02 जोड़ता है।
tool_code_interpreterबूलियननहींगलतसैंडबॉक्स में पायथन कोड चलाएँ। सोचने की जरूरत है। प्रत्येक इन्वेटेड कोड दुभाषिया कॉल के लिए अनुरोध लागत में $0.02 जोड़ता है।
disable_formattingबूलियननहींगलतEmpirioLabs स्रोत स्वरूपण के बिना कच्चे प्रदाता-शैली आउटपुट लौटाएं जहां समर्थित हो।

टिप्पणियाँ

केवल पाठ इनपुट। वेब खोज, वेब चिमटा और कोड दुभाषिया वैकल्पिक अंतर्निहित उपकरण हैं जो tool_* मापदंडों के माध्यम से उजागर होते हैं। प्रत्येक अंतर्निहित टूल कॉल $0.02 को लागू करने पर जोड़ता है। थिंकिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर अंतर्निहित टूल का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र को वहन करती है। टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं और पारदर्शिता के लिए सामने आए हैं।

विकल्प

:variant1

फ़ील्डमूल्य
मॉडल आईडीqwen3-7-max:variant1
मॉडल रिलीज की तारीख2026-05-21
क्षेत्रचीन
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन65,536
सुविधाऐंरीजनिंग, web_search, code_interpreter, function_calling, agentic_coding
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$1.65 ($2.50 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन$4.951 ($7.50 था)
वेब खोजप्रति कॉल जब लागू किया जाता है$0.01
वेब चिमटाप्रति कॉल जब लागू किया जाता है$0.01
कोड दुभाषियाप्रति कॉल जब लागू किया जाता है$0.01

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले तर्क सक्षम करें।
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। · अनुमति: none, low, medium, high, max
thinking_budgetसंख्यानहीं32768सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 64000
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.01 जोड़ता है.
tool_web_extractorबूलियननहींगलतURL से सामग्री निकालें और पढ़ें। वेब खोज और सोच की आवश्यकता है। प्रत्येक आह्वान किए गए वेब चिमटा कॉल के लिए अनुरोध लागत में $0.01 जोड़ता है।
tool_code_interpreterबूलियननहींगलतसैंडबॉक्स में पायथन कोड चलाएँ। सोचने की जरूरत है। प्रत्येक इन्वेटेड कोड दुभाषिया कॉल के लिए अनुरोध लागत में $0.01 जोड़ता है।
disable_formattingबूलियननहींगलतEmpirioLabs स्रोत स्वरूपण के बिना कच्चे प्रदाता-शैली आउटपुट लौटाएं जहां समर्थित हो।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max