Qwen3.6 Max Preview

Qwen3.6 Max Preview
Alibaba Cloud · Text Generation
POST /v1/chat/completions

3.6 श्रृंखला में सबसे बड़ा पूर्वावलोकन संस्करण (केवल-पाठ): बेहतर कोडिंग एजेंट निष्पादन, मजबूत फ्रंट-एंड कौशल और व्यापक लंबी-पूंछ ज्ञान।

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीqwen3-6-max-preview
मॉडल रिलीज की तारीख2026-04-20
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो256 के
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन65,536
क्षेत्रसिंगापुर
सुविधाऐंरीजनिंग, agentic_coding, web_search
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages
बहिष्करण तिथि2026-09-08

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन<=128K $1.31; 128K-256K $1.97
उत्पादनप्रति 1M जेनरेट किए गए टोकन<=128K $7.88; 128K-256K $11.82
वेब खोजप्रति कॉल$0.020

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान · रेंज: 0 - 2
top_pसंख्यानहीं1.0नाभिक नमूनाकरण · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन · रेंज: 1 - 65536
frequency_penaltyसंख्यानहीं0बार-बार टोकन के लिए जुर्माना। >0 दोहराव को कम करता है, <0 इसे प्रोत्साहित करता है। · रेंज: -2 - 2
presence_penaltyसंख्यानहीं0नए बनाम देखे गए टोकन के लिए जुर्माना। >0 नए विषयों को प्रोत्साहित करता है, <0 विषय पर बने रहने को प्रोत्साहित करता है। · रेंज: -2 - 2
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
stopतारनहीं-अल्पविराम से अलग स्टॉप अनुक्रम
enable_thinkingबूलियननहींसचउत्तर देने से पहले कारण step-by-step
thinking_budgetसंख्यानहीं32768सोचने के लिए आरक्षित टोकन · रेंज: 1 - 393216
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें।
disable_formattingबूलियननहींगलतEmpirioLabs मार्कडाउन स्वरूपण (उद्धरण [N] पुनर्लेखन + संदर्भ ब्लॉक जब वेब खोज/उपकरण का उपयोग किया गया था) को छोड़ दें। सादे [N] उद्धरणों के साथ कच्चा अपस्ट्रीम उत्तर वापस कर दिया जाता है।

टिप्पणियाँ

मूल्य निर्धारण 1.5K टोकन से ~128x ऊपर है। केवल इस पूर्वावलोकन में सादा-पाठ क्षमताएं; मल्टीमॉडल अभी तक सक्षम नहीं है।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र ले जाती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-6-max-preview