Qwen3.5 Flash | EmpirioLabs AI Docs

POST /v1/chat/completions

हाइब्रिड रैखिक-ध्यान प्लस विरल MoE, 1M संदर्भ, और तेज़ मल्टीमॉडल text/image/वीडियो अनुमान के साथ दृष्टि-भाषा मॉडल।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-5-flash`
मॉडल रिलीज की तारीख	2026-02-24
इनपुट तौर-तरीके	पाठ, छवि, वीडियो
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	32,768
क्षेत्र	सिंगापुर
सुविधाऐं	दृष्टि, web_search, code_interpreter, function_calling
मूल अनुमान	नहीं
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$0.090 ($0.10 था)
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$0.368 ($0.40 था)
वेब खोज	प्रति कॉल	$0.015
छवि खोज	प्रति कॉल	$0.012

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-5-flash", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 32768
`enable_thinking`	बूलियन	नहीं	सच	विस्तारित सोच मोड सक्षम करें। धीमा लेकिन तर्क-भारी कार्यों में सुधार करता है।
`vl_high_resolution_images`	बूलियन	नहीं	सच	इनपुट छवियों के लिए उच्च रिज़ॉल्यूशन का उपयोग करें। उच्च लागत पर बेहतर विवरण।
`max_pixels`	संख्या	नहीं	`2621440`	प्रति इनपुट छवि अधिकतम पिक्सेल। बड़ा = अधिक विवरण लेकिन धीमा/अधिक टोकन। · रेंज: 1 - 99999999
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें।
`tool_web_extractor`	बूलियन	नहीं	सच	URL से सामग्री निकालें और पढ़ें। वेब खोज और सोच की आवश्यकता है।
`tool_code_interpreter`	बूलियन	नहीं	सच	सैंडबॉक्स में पायथन कोड चलाएँ। सोचने की जरूरत है।
`tool_web_search_image`	बूलियन	नहीं	सच	पाठ विवरण से छवियों के लिए वेब पर खोजें।
`tool_image_search`	बूलियन	नहीं	सच	अपलोड की गई छवि से मिलते-जुलते चित्र ढूंढें.
`video_fps`	संख्या	नहीं	`2`	विश्लेषण के लिए इनपुट वीडियो से फ्रेम्स-प्रति-सेकंड का नमूना लिया गया। · रेंज: 0.1 - 10
`treat_images_as_video`	बूलियन	नहीं	गलत	अस्थायी तर्क के लिए एक वीडियो के रूप में इनपुट छवियों के एक अनुक्रम का इलाज करें।
`disable_formatting`	बूलियन	नहीं	गलत	EmpirioLabs मार्कडाउन स्वरूपण (उद्धरण [N] पुनर्लेखन + संदर्भ ब्लॉक जब वेब खोज/उपकरण का उपयोग किया गया था) को छोड़ दें। सादे [N] उद्धरणों के साथ कच्चा अपस्ट्रीम उत्तर वापस कर दिया जाता है।

टेक्स्ट-टू-इमेज खोज और इमेज-टू-इमेज सर्च इमेज सर्च मूल्य निर्धारण पंक्ति का उपयोग करें. प्रत्येक आह्वान की गई छवि खोज को उस सूचीबद्ध प्रति-कॉल दर पर बिल किया जाता है।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र ले जाती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।

विकल्प

`:variant1`

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-5-flash:variant1`
मॉडल रिलीज की तारीख	2026-02-24
क्षेत्र	चीन
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	65,536
सुविधाऐं	रीजनिंग, विजन, वीडियो, web_search, function_calling, structured_output, agentic_coding
मूल अनुमान	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	<=128K $0.029 ($0.090 था); 128K-256K $0.115; 256K-1M $0.172
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	<=128K $0.287 ($0.368 था); 128K-256K $1.147; 256K-1M $1.72
वेब खोज	सक्षम होने पर प्रति क्वेरी	$0.01

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 65536
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले तर्क सक्षम करें।
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	संख्या	नहीं	`32768`	सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 80000
`response_format`	वस्तु	नहीं	-	OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप। सख्त स्कीमा के लिए गैर-सोच मोड का उपयोग करें।
`vl_high_resolution_images`	बूलियन	नहीं	सच	छवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें।
`max_pixels`	संख्या	नहीं	`2621440`	उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216
`video_fps`	संख्या	नहीं	`2`	वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-5-flash।