Qwen3.6 Max Preview | EmpirioLabs AI Docs

POST /v1/chat/completions

3.6 श्रृंखला में सबसे बड़ा पूर्वावलोकन संस्करण (केवल-पाठ): बेहतर कोडिंग एजेंट निष्पादन, मजबूत फ्रंट-एंड कौशल और व्यापक लंबी-पूंछ ज्ञान।

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-6-max-preview`
मॉडल रिलीज की तारीख	2026-04-20
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	256 के
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	65,536
क्षेत्र	सिंगापुर
सुविधाऐं	रीजनिंग, agentic_coding, web_search
मूल अनुमान	नहीं
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`
बहिष्करण तिथि	2026-09-08

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	<=128K $1.31; 128K-256K $1.97
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	<=128K $7.88; 128K-256K $11.82
वेब खोज	प्रति कॉल	$0.020

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-6-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`1.0`	नाभिक नमूनाकरण · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन · रेंज: 1 - 65536
`frequency_penalty`	संख्या	नहीं	`0`	बार-बार टोकन के लिए जुर्माना। >0 दोहराव को कम करता है, <0 इसे प्रोत्साहित करता है। · रेंज: -2 - 2
`presence_penalty`	संख्या	नहीं	`0`	नए बनाम देखे गए टोकन के लिए जुर्माना। >0 नए विषयों को प्रोत्साहित करता है, <0 विषय पर बने रहने को प्रोत्साहित करता है। · रेंज: -2 - 2
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`stop`	तार	नहीं	-	अल्पविराम से अलग स्टॉप अनुक्रम
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले कारण step-by-step
`thinking_budget`	संख्या	नहीं	`32768`	सोचने के लिए आरक्षित टोकन · रेंज: 1 - 393216
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें।
`disable_formatting`	बूलियन	नहीं	गलत	EmpirioLabs मार्कडाउन स्वरूपण (उद्धरण [N] पुनर्लेखन + संदर्भ ब्लॉक जब वेब खोज/उपकरण का उपयोग किया गया था) को छोड़ दें। सादे [N] उद्धरणों के साथ कच्चा अपस्ट्रीम उत्तर वापस कर दिया जाता है।

जब यह मॉडल एक ही अनुरोध के अंदर टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र ले जाती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-6-max-preview।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ