Qwen3.5 Flash | EmpirioLabs AI Docs

POST /v1/chat/completions

Vision-language model with hybrid linear-attention plus sparse MoE, 1M context, and fast multimodal text/image /video inference.

في لمحة

الميدان	القيمة
النموذج	`qwen3-5-flash`
تاريخ الإفراج النموذجي	2026-02-24
طرائق المدخلات	النص، التصوير، الفيديو
طرائق النواتج	النص
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	32,768
المنطقة	سنغافورة
المعالم	الرؤيا، البحث على شبكة الإنترنت، الشفرة، الترجمة التحريرية، الوظيفة
Native inference	لا
جديدة	لا
نقاط النهاية المدعومة	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

الطباعة

الرسم	Spec	المعدل
الناتج	1M	$0.090 (كان $0.10)
الناتج	1M المولدة	$0.368 (كان $0.40)
Web search	لكل مكالمة	$0.015
البحث عن الصور	لكل مكالمة	$0.012

طلب مثال

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-5-flash", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامترات	النوع	المطلوبة	التقصير	الوصف
`temperature`	العدد	لا	`0.7`	درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
`top_p`	العدد	لا	`0.9`	نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
`max_tokens`	العدد	لا	`4096`	الحد الأقصى للعلامات في الرد الرنج: 1-32768
`enable_thinking`	boolean	لا	صحيح	طريقة تفكير مطولة أبطأ، ولكن يحسن المهام الحثيثة.
`vl_high_resolution_images`	boolean	لا	صحيح	استعملوا حلاً أعلى لصور المدخلات تفاصيل أفضل بكلفة أعلى
`max_pixels`	العدد	لا	`2621440`	”أقصى ما يمكن” أكبر = المزيد من التفاصيل ولكن أبطأ/مزيد من الكسور الرنج: 1 - 99999999
`tool_web_search`	boolean	لا	كاذب	ابحث عن الشبكة من أجل المعلومات في الوقت الحقيقي
`tool_web_extractor`	boolean	لا	صحيح	Extract and read content from URLs. يتطلب البحث والتفكير
`tool_code_interpreter`	boolean	لا	صحيح	اجري رمز (بيثون) في صندوق رمال يتطلب التفكير
`tool_web_search_image`	boolean	لا	صحيح	فتش الشبكة من أجل الصور من وصفات النص
`tool_image_search`	boolean	لا	صحيح	ابحث عن صور مماثلة من صورة محملة
`video_fps`	العدد	لا	`2`	تم أخذ عينة من شريط فيديو من أجل التحليل الرنج: 0.1 - 10
`treat_images_as_video`	boolean	لا	كاذب	معالجة سلسلة من صور المدخلات كفيديو للتفسير الزمني
`disable_formatting`	boolean	لا	كاذب	Skip the EmpirioLabs Markdown formatting (citation [N] rewriting + References block when web search / tools were used). ويعاد الرد النافذ على الاستشهاد البسيط.

الحواشي

** الأدوات ذات الطابع الخاص** (لم تُدفع إلا عند التذرع بها)

Web search: $0.015/call
مستخرج على شبكة الإنترنت: مجاني
مترجم شفوي حر
البحث من النص إلى صورة: $0.012/call
Image-to-image search: $0.012/call

** أخرى**

المفكرون يدونون كعلامات ناتجة

البحث عن الصور و البحث عن الصور باستخدام صف التسعير وكل بحث للصور يُحتج به يتم فواتيره حسب المعدل المدرج لكل مرتب.

الفوترة لكل أداة (usage.tool_usage)

When this model invokeds tools (web search, code interpreter, etc.) inside a single request, the response carries a normalized EL usage.tool_usage map along the token counts. ويوضح المثال الوارد أدناه الشكل - الاسمان الميدانيان الدقيقان، والوحدات، والأدوات التي تظهر يمكن أن تختلف اختلافا طفيفا لكل مقدم:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

يتم بالفعل احتساب عدد الأدوات في cost_usd - يتم إبراز الشفافية حتى تتمكن من تدقيق الفوترة لكل أداة. يتم حذف الحقل عندما لا يتم استدعاء أي أدوات.

المتغيرات

`:variant1`

الميدان	القيمة
النموذج	`qwen3-5-flash:variant1`
تاريخ الإفراج النموذجي	2026-02-24
المنطقة	الصين
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	65,536
المعالم	التعليل، الرؤية، الفيديو، البحث على شبكة الإنترنت، الوظيفة
Native inference	لا
نقاط النهاية المدعومة	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

** تسعير**

الرسم	Spec	المعدل
الناتج	1M	<=128K $0.029 (كان $0.090); 128K-256K $0.115; 256K-1M $0.172
الناتج	1M المولدة	<=128K $0.287 (كان $0.368); 128K-256K $1.147; 256K-1M $1.72
البحث على شبكة الإنترنت	كل استفسار مُتاح	$0.01

** بارامترات**

البارامترات	النوع	المطلوبة	التقصير	الوصف
`temperature`	العدد	لا	`0.7`	درجة حرارة أخذ العينات لا شيء محدد واثنين هو أقصى عشوائية الرنج: صفر - 2
`top_p`	العدد	لا	`0.9`	نوكليوس أخذ عينات كتلة احتمالية فالقيم الدنيا تجعل النواتج أكثر تركيزا. الرنج: صفر - 1
`max_tokens`	العدد	لا	`4096`	الحد الأقصى للناتج الرنج: 1-65536
`stop`	سلسلة	لا	-	حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
`enable_thinking`	boolean	لا	صحيح	يمكن التفكير قبل الإجابة
`reasoning_effort`	enum	لا	`"medium"`	مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: `none`، `low`، `medium`، `high`، `max`
`thinking_budget`	العدد	لا	`32768`	الحد الأقصى للذكورات المحجوزة للتفسير عندما يُمكن التفكير الرنج: 1 - 80000
`response_format`	الجسم	لا	-	OpenAI-compatible JSON mode or JSON schema response format. استخدمي أسلوب عدم التفكير في الكيماويات الصارمة
`vl_high_resolution_images`	boolean	لا	صحيح	(ج) استخدام تجهيزات أعلى لمعالجة الصور.
`max_pixels`	العدد	لا	`2621440`	الحد الأقصى من البكسل يحسب لكل صورة عندما يكون التجهيز العالي للحلوى معوقا. الرنج: 4096 - 16777216
`video_fps`	العدد	لا	`2`	فطرات في الثانية إلى عينة من مدخلات الفيديو. الرنج: 0.1 - 10
`tool_web_search`	boolean	لا	كاذب	ابحث في الإنترنت عن معلومات فورية. يضيف $0.01 إلى تكلفة الطلب عند تفعيله.

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/qwen3-5-flash.