Qwen3.7 Max | EmpirioLabs AI Docs

POST /v1/chat/completions

Qwen3.7 Max कोडिंग, उत्पादकता, लंबे समय तक चलने वाले एजेंटों, गहरी सोच, उपकरण और 1M-टोकन संदर्भ के लिए एक प्रमुख टेक्स्ट मॉडल है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-7-max`
मॉडल रिलीज की तारीख	2026-05-21
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	65,536
क्षेत्र	सिंगापुर
सुविधाऐं	रीजनिंग, web_search, code_interpreter, function_calling, agentic_coding
मूल अनुमान	नहीं
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$2.50
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$7.50
वेब खोज	प्रति कॉल जब लागू किया जाता है	$0.02
वेब चिमटा	प्रति कॉल जब लागू किया जाता है	$0.02
कोड दुभाषिया	प्रति कॉल जब लागू किया जाता है	$0.02

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले तर्क सक्षम करें।
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	संख्या	नहीं	`32768`	सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 64000
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.02 जोड़ता है.
`tool_web_extractor`	बूलियन	नहीं	गलत	URL से सामग्री निकालें और पढ़ें। वेब खोज और सोच की आवश्यकता है। प्रत्येक आह्वान किए गए वेब चिमटा कॉल के लिए अनुरोध लागत में $0.02 जोड़ता है।
`tool_code_interpreter`	बूलियन	नहीं	गलत	सैंडबॉक्स में पायथन कोड चलाएँ। सोचने की जरूरत है। प्रत्येक इन्वेटेड कोड दुभाषिया कॉल के लिए अनुरोध लागत में $0.02 जोड़ता है।
`disable_formatting`	बूलियन	नहीं	गलत	EmpirioLabs स्रोत स्वरूपण के बिना कच्चे प्रदाता-शैली आउटपुट लौटाएं जहां समर्थित हो।

केवल पाठ इनपुट। वेब खोज, वेब चिमटा और कोड दुभाषिया वैकल्पिक अंतर्निहित उपकरण हैं जो tool_* मापदंडों के माध्यम से उजागर होते हैं। प्रत्येक अंतर्निहित टूल कॉल $0.02 को लागू करने पर जोड़ता है। थिंकिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर अंतर्निहित टूल का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र को वहन करती है। टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं और पारदर्शिता के लिए सामने आए हैं।

विकल्प

`:variant1`

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-7-max:variant1`
मॉडल रिलीज की तारीख	2026-05-21
क्षेत्र	चीन
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	65,536
सुविधाऐं	रीजनिंग, web_search, code_interpreter, function_calling, agentic_coding
मूल अनुमान	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$1.65 ($2.50 था)
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$4.951 ($7.50 था)
वेब खोज	प्रति कॉल जब लागू किया जाता है	$0.01
वेब चिमटा	प्रति कॉल जब लागू किया जाता है	$0.01
कोड दुभाषिया	प्रति कॉल जब लागू किया जाता है	$0.01

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले तर्क सक्षम करें।
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	संख्या	नहीं	`32768`	सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 64000
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.01 जोड़ता है.
`tool_web_extractor`	बूलियन	नहीं	गलत	URL से सामग्री निकालें और पढ़ें। वेब खोज और सोच की आवश्यकता है। प्रत्येक आह्वान किए गए वेब चिमटा कॉल के लिए अनुरोध लागत में $0.01 जोड़ता है।
`tool_code_interpreter`	बूलियन	नहीं	गलत	सैंडबॉक्स में पायथन कोड चलाएँ। सोचने की जरूरत है। प्रत्येक इन्वेटेड कोड दुभाषिया कॉल के लिए अनुरोध लागत में $0.01 जोड़ता है।
`disable_formatting`	बूलियन	नहीं	गलत	EmpirioLabs स्रोत स्वरूपण के बिना कच्चे प्रदाता-शैली आउटपुट लौटाएं जहां समर्थित हो।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max।