Qwen3.6 Flash

Alibaba Cloud · Text Generation
POST /v1/chat/completionsएजेटिक कोडिंग, गणित तर्क, स्थानिक समझ, ओसीआर, और पाठ, छवि और वीडियो इनपुट के लिए फास्ट Qwen3.6 दृष्टि-भाषा मॉडल।
एक नजर में
| फ़ील्ड | मूल्य |
|---|---|
| मॉडल आईडी | qwen3-6-flash |
| मॉडल रिलीज की तारीख | 2026-04-16 |
| इनपुट तौर-तरीके | पाठ, छवि, वीडियो |
| आउटपुट के तौर-तरीके | टेक्स्ट |
| संदर्भ विंडो | 1 मी |
| वजन परिशुद्धता | - |
| अधिकतम आउटपुट टोकन | 65,536 |
| क्षेत्र | सिंगापुर |
| सुविधाऐं | रीजनिंग, विजन, वीडियो, web_search, function_calling, structured_output, agentic_coding |
| मूल अनुमान | नहीं |
| नया | हाँ |
| समर्थित समापन बिंदु | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
मूल्य निर्धारण
| आवेशित करना | युक्ति | दर |
|---|---|---|
| इनपुट | प्रति 1M प्रॉम्प्ट टोकन | <=256K $0.25; 256K-1M $1.00 |
| उत्पादन | प्रति 1M जेनरेट किए गए टोकन | <=256K $1.50; 256K-1M $4.00 |
| वेब खोज | सक्षम होने पर प्रति क्वेरी | $0.02 |
उदाहरण अनुरोध
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'
पैरामीटर
| प्राचल | प्रकार | आवश्यक | डिफ़ॉल्ट | या क़िस्म |
|---|---|---|---|---|
temperature | संख्या | नहीं | 0.7 | नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2 |
top_p | संख्या | नहीं | 0.9 | नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1 |
max_tokens | संख्या | नहीं | 4096 | अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536 |
stop | तार | नहीं | - | 4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा। |
enable_thinking | बूलियन | नहीं | सच | उत्तर देने से पहले तर्क सक्षम करें। |
reasoning_effort | एनम | नहीं | "medium" | तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max |
thinking_budget | संख्या | नहीं | 32768 | सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 64000 |
response_format | वस्तु | नहीं | - | OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप। सख्त स्कीमा के लिए गैर-सोच मोड का उपयोग करें। |
vl_high_resolution_images | बूलियन | नहीं | सच | छवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें। |
max_pixels | संख्या | नहीं | 2621440 | उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216 |
video_fps | संख्या | नहीं | 2 | वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10 |
tool_web_search | बूलियन | नहीं | गलत | वास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.02 जोड़ता है। |
टिप्पणियाँ
टेक्स्ट, छवि और वीडियो इनपुट का समर्थन करता है। वेब खोज tool_web_search के माध्यम से उपलब्ध है और सक्षम होने पर प्रति क्वेरी $0.02 जोड़ती है. थिंकिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है। स्पष्ट कैश नियंत्रण समर्थित नहीं हैं.
विकल्प
:variant1
| फ़ील्ड | मूल्य |
|---|---|
| मॉडल आईडी | qwen3-6-flash:variant1 |
| मॉडल रिलीज की तारीख | 2026-04-16 |
| क्षेत्र | चीन |
| संदर्भ विंडो | 1 मी |
| वजन परिशुद्धता | - |
| अधिकतम आउटपुट टोकन | 65,536 |
| सुविधाऐं | रीजनिंग, विजन, वीडियो, web_search, function_calling, structured_output, agentic_coding |
| मूल अनुमान | नहीं |
| समर्थित समापन बिंदु | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
मूल्य निर्धारण
| आवेशित करना | युक्ति | दर |
|---|---|---|
| इनपुट | प्रति 1M प्रॉम्प्ट टोकन | <=256K $0.165 ($0.25 था); 256K-1M $0.66 ($1.00 था) |
| उत्पादन | प्रति 1M जेनरेट किए गए टोकन | <=256K $0.99 ($1.50 था); 256K-1M $3.961 ($4.00 था) |
| वेब खोज | सक्षम होने पर प्रति क्वेरी | $0.01 |
पैरामीटर
| प्राचल | प्रकार | आवश्यक | डिफ़ॉल्ट | या क़िस्म |
|---|---|---|---|---|
temperature | संख्या | नहीं | 0.7 | नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2 |
top_p | संख्या | नहीं | 0.9 | नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1 |
max_tokens | संख्या | नहीं | 4096 | अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536 |
stop | तार | नहीं | - | 4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा। |
enable_thinking | बूलियन | नहीं | सच | उत्तर देने से पहले तर्क सक्षम करें। |
reasoning_effort | एनम | नहीं | "medium" | तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max |
thinking_budget | संख्या | नहीं | 32768 | सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 128000 |
response_format | वस्तु | नहीं | - | OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप। सख्त स्कीमा के लिए गैर-सोच मोड का उपयोग करें। |
vl_high_resolution_images | बूलियन | नहीं | सच | छवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें। |
max_pixels | संख्या | नहीं | 2621440 | उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216 |
video_fps | संख्या | नहीं | 2 | वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10 |
tool_web_search | बूलियन | नहीं | गलत | वास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है। |
Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash।
