DeepSeek V4 Flash | EmpirioLabs AI Docs

DeepSeek · Text Generation

POST /v1/chat/completions

نموذج وزارة الوزن الخفيف الذي يبلغ مجموعه 284 باء/13 باء بارامترات ناشطة وسياق السكان الأصليين 1M، مخصوماً من الاستخدام المنخفض البطيء والفعال من حيث التكلفة من حيث التجانس.

في لمحة

الميدان	القيمة
النموذج	`deepseek-v4-flash`
تاريخ الإفراج النموذجي	2026-04-24
طرائق المدخلات	النص
طرائق النواتج	النص
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	393,216
المنطقة	ألمانيا
المعالم	المنطق
Native inference	لا
جديدة	نعم
نقاط النهاية المدعومة	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

الطباعة

الرسم	Spec	المعدل
الناتج	1M	$0.14
الناتج	1M المولدة	$0.28
البحث على شبكة الإنترنت (Linkup)	عند التذرع	$0.013

طلب مثال

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "deepseek-v4-flash", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامترات	النوع	المطلوبة	التقصير	الوصف
`temperature`	العدد	لا	`0.7`	درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
`top_p`	العدد	لا	`0.9`	نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
`max_tokens`	العدد	لا	`4096`	الحد الأقصى للناتج الرنج: 1 - 393216
`stop`	سلسلة	لا	-	حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
`enable_thinking`	boolean	لا	صحيح	فعل step-by-step المنطق قبل الإجابة.
`thinking_budget`	العدد	لا	`32768`	الحد الأقصى للقطع المحجوزة لعملية التعليل حتى 393216 الرنج: 1 - 393216
`reasoning_effort`	enum	لا	`"medium"`	مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: `none`، `low`، `medium`، `high`، `max`
`web_search_linkup`	boolean	لا	كاذب	بحث ويب اختياري مدعوم من لينك أب. عند تفعيلها، يتم استرجاع مصادر الويب الحديثة باستخدام رسالة المستخدم الأخيرة كاستعلام وتقديمها للنموذج كسياق إضافي. يضيف $0.013 ثابتة لكل طلب بالإضافة إلى تكلفة الرمز العادية للنموذج. معطلة بشكل افتراضي.
`disable_formatting`	boolean	لا	كاذب	عند تفعيلها، لا تضم البوابة تذيل “المصادر” إلى ردود المساعدين التي استخدمت Linkup البحث على الويب. مفيد عندما يتم نقل مخرج النموذج إلى نظام آخر لا يتوقع أي زخرفة.

المتغيرات

`:variant1`

الميدان	القيمة
النموذج	`deepseek-v4-flash:variant1`
تاريخ الإفراج النموذجي	2026-04-24
المنطقة	سنغافورة
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	393,216
المعالم	التعليل، البحث على شبكة الإنترنت
Native inference	لا
نقاط النهاية المدعومة	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

** تسعير**

الرسم	Spec	المعدل
الناتج	1M	$0.20
الناتج	1M المولدة	$0.40
البحث على شبكة الإنترنت	حسب الطلب	$0.02

** بارامترات**

البارامترات	النوع	المطلوبة	التقصير	الوصف
`temperature`	العدد	لا	`0.7`	درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
`top_p`	العدد	لا	`0.9`	نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
`max_tokens`	العدد	لا	`4096`	الحد الأقصى للناتج الرنج: 1 - 393216
`stop`	سلسلة	لا	-	حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
`enable_thinking`	boolean	لا	صحيح	فعل step-by-step المنطق قبل الإجابة.
`thinking_budget`	العدد	لا	`32768`	الحد الأقصى للقطع المحجوزة لعملية التعليل حتى 393216 الرنج: 1 - 393216
`reasoning_effort`	enum	لا	`"medium"`	مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: `none`، `low`، `medium`، `high`، `max`
`tool_web_search`	boolean	لا	كاذب	فعل البحث المباشر على الويب. تضيف رسوما إضافية $0.02 إلى تكلفة الطلب عند تفعيلها.

`:variant2`

الميدان	القيمة
النموذج	`deepseek-v4-flash:variant2`
تاريخ الإفراج النموذجي	2026-04-24
المنطقة	الصين
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	384,000
المعالم	التعليل، الوظيفة
Native inference	لا
نقاط النهاية المدعومة	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

** تسعير**

الرسم	Spec	المعدل
الناتج	1M	$0.138 (كان $0.14)
الناتج	1M المولدة	$0.275 (كان $0.28)
يُقرأ المخبأ	1M cached input tokens	$0.028
البحث على شبكة الإنترنت	حسب الطلب	$0.01

** بارامترات**

البارامترات	النوع	المطلوبة	التقصير	الوصف
`temperature`	العدد	لا	`0.7`	درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
`top_p`	العدد	لا	`0.9`	نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
`max_tokens`	العدد	لا	`4096`	الحد الأقصى للناتج الرنج: 1 - 393216
`stop`	سلسلة	لا	-	حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
`enable_thinking`	boolean	لا	صحيح	فعل step-by-step المنطق قبل الإجابة.
`thinking_budget`	العدد	لا	`32768`	الحد الأقصى للقطع المحجوزة لعملية التعليل حتى 393216 الرنج: 1 - 393216
`reasoning_effort`	enum	لا	`"medium"`	مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: `none`، `low`، `medium`، `high`، `max`
`tool_web_search`	boolean	لا	كاذب	فعل البحث المباشر على الويب. يضيف $0.01 إلى تكلفة الطلب عند تفعيله.

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-flash.