Qwen3 Max Thinking | EmpirioLabs AI Docs

POST /v1/chat/completions

अनुकूली उपकरण उपयोग (खोज, मेमोरी, कोड दुभाषिया) और जटिल कार्यों पर उच्च सटीकता के लिए परीक्षण-समय स्केलिंग के साथ तर्क मॉडल।

This model is deprecated and will be retired on 2026-07-08. After that date, requests to this model will fail. Migrate to a successor model before then.

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-max-thinking`
मॉडल रिलीज की तारीख	2025-09-23
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	256 के
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	65,536
क्षेत्र	सिंगापुर
सुविधाऐं	तर्क, code_interpreter, web_search, सोच
मूल अनुमान	नहीं
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`
बहिष्करण तिथि	2026-07-08

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	<=32K $1.08 ($1.20 था); 32K-128K $2.16 ($2.40 था); 128K-256K $2.70 ($3.00 था)
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	<=32K $5.52 ($6.00 था); 32K-128K $11.04 ($12.00 था); 128K-256K $13.80 ($15.00 था)
वेब खोज	प्रति अनुरोध	$0.015

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-max-thinking", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 65536
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	विस्तारित सोच मोड सक्षम करें। धीमा लेकिन तर्क-भारी कार्यों में सुधार करता है।
`tool_web_search`	बूलियन	नहीं	गलत	जरूरत पड़ने पर मॉडल को वेब खोज करने की अनुमति दें।
`web_search_mode`	एनम	नहीं	`"standard"`	मानक = एकल खोज, पूरी तरह से = कई गहरी खोजें। · अनुमति: `standard`, `thorough`
`tool_code_interpreter`	बूलियन	नहीं	सच	डेटा की गणना/विश्लेषण करने के लिए मॉडल को सैंडबॉक्स में पायथन कोड निष्पादित करने की अनुमति दें।
`tool_web_extractor`	बूलियन	नहीं	सच	मॉडल को अपने द्वारा खोजे गए URL से सामग्री लाने और पढ़ने की अनुमति दें.
`disable_formatting`	बूलियन	नहीं	गलत	EmpirioLabs मार्कडाउन स्वरूपण (उद्धरण [N] पुनर्लेखन + संदर्भ ब्लॉक जब वेब खोज/उपकरण का उपयोग किया गया था) को छोड़ दें। सादे [N] उद्धरणों के साथ कच्चा अपस्ट्रीम उत्तर वापस कर दिया जाता है।

जब यह मॉडल एक ही अनुरोध के अंदर टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र ले जाती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-max-thinking।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ