Qwen3.6 Flash

Qwen3.6 Flash
Alibaba Cloud · Text Generation
POST /v1/chat/completions

एजेटिक कोडिंग, गणित तर्क, स्थानिक समझ, ओसीआर, और पाठ, छवि और वीडियो इनपुट के लिए फास्ट Qwen3.6 दृष्टि-भाषा मॉडल।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीqwen3-6-flash
मॉडल रिलीज की तारीख2026-04-16
इनपुट तौर-तरीकेपाठ, छवि, वीडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन65,536
क्षेत्रसिंगापुर
सुविधाऐंरीजनिंग, विजन, वीडियो, web_search, function_calling, structured_output, agentic_coding
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन<=256K $0.25; 256K-1M $1.00
उत्पादनप्रति 1M जेनरेट किए गए टोकन<=256K $1.50; 256K-1M $4.00
वेब खोजसक्षम होने पर प्रति क्वेरी$0.02

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले तर्क सक्षम करें।
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
thinking_budgetसंख्यानहीं32768सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 64000
response_formatवस्तुनहीं-OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप। सख्त स्कीमा के लिए गैर-सोच मोड का उपयोग करें।
vl_high_resolution_imagesबूलियननहींसचछवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें।
max_pixelsसंख्यानहीं2621440उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216
video_fpsसंख्यानहीं2वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.02 जोड़ता है।

टिप्पणियाँ

टेक्स्ट, छवि और वीडियो इनपुट का समर्थन करता है। वेब खोज tool_web_search के माध्यम से उपलब्ध है और सक्षम होने पर प्रति क्वेरी $0.02 जोड़ती है. थिंकिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है। स्पष्ट कैश नियंत्रण समर्थित नहीं हैं.

विकल्प

:variant1

फ़ील्डमूल्य
मॉडल आईडीqwen3-6-flash:variant1
मॉडल रिलीज की तारीख2026-04-16
क्षेत्रचीन
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन65,536
सुविधाऐंरीजनिंग, विजन, वीडियो, web_search, function_calling, structured_output, agentic_coding
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन<=256K $0.165 ($0.25 था); 256K-1M $0.66 ($1.00 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन<=256K $0.99 ($1.50 था); 256K-1M $3.961 ($4.00 था)
वेब खोजसक्षम होने पर प्रति क्वेरी$0.01

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले तर्क सक्षम करें।
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
thinking_budgetसंख्यानहीं32768सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 128000
response_formatवस्तुनहीं-OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप। सख्त स्कीमा के लिए गैर-सोच मोड का उपयोग करें।
vl_high_resolution_imagesबूलियननहींसचछवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें।
max_pixelsसंख्यानहीं2621440उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216
video_fpsसंख्यानहीं2वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash