Qwen3.6 Flash | EmpirioLabs AI Docs

POST /v1/chat/completions

एजेटिक कोडिंग, गणित तर्क, स्थानिक समझ, ओसीआर, और पाठ, छवि और वीडियो इनपुट के लिए फास्ट Qwen3.6 दृष्टि-भाषा मॉडल।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-6-flash`
मॉडल रिलीज की तारीख	2026-04-16
इनपुट तौर-तरीके	पाठ, छवि, वीडियो
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	65,536
क्षेत्र	सिंगापुर
सुविधाऐं	रीजनिंग, विजन, वीडियो, web_search, function_calling, structured_output, agentic_coding
मूल अनुमान	नहीं
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	<=256K $0.25; 256K-1M $1.00
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	<=256K $1.50; 256K-1M $4.00
वेब खोज	सक्षम होने पर प्रति क्वेरी	$0.02

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले तर्क सक्षम करें।
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	संख्या	नहीं	`32768`	सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 64000
`response_format`	वस्तु	नहीं	-	OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप। सख्त स्कीमा के लिए गैर-सोच मोड का उपयोग करें।
`vl_high_resolution_images`	बूलियन	नहीं	सच	छवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें।
`max_pixels`	संख्या	नहीं	`2621440`	उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216
`video_fps`	संख्या	नहीं	`2`	वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.02 जोड़ता है।

टेक्स्ट, छवि और वीडियो इनपुट का समर्थन करता है। वेब खोज tool_web_search के माध्यम से उपलब्ध है और सक्षम होने पर प्रति क्वेरी $0.02 जोड़ती है. थिंकिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है। स्पष्ट कैश नियंत्रण समर्थित नहीं हैं.

विकल्प

`:variant1`

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-6-flash:variant1`
मॉडल रिलीज की तारीख	2026-04-16
क्षेत्र	चीन
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	65,536
सुविधाऐं	रीजनिंग, विजन, वीडियो, web_search, function_calling, structured_output, agentic_coding
मूल अनुमान	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	<=256K $0.165 ($0.25 था); 256K-1M $0.66 ($1.00 था)
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	<=256K $0.99 ($1.50 था); 256K-1M $3.961 ($4.00 था)
वेब खोज	सक्षम होने पर प्रति क्वेरी	$0.01

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले तर्क सक्षम करें।
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	संख्या	नहीं	`32768`	सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 128000
`response_format`	वस्तु	नहीं	-	OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप। सख्त स्कीमा के लिए गैर-सोच मोड का उपयोग करें।
`vl_high_resolution_images`	बूलियन	नहीं	सच	छवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें।
`max_pixels`	संख्या	नहीं	`2621440`	उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216
`video_fps`	संख्या	नहीं	`2`	वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash।