DeepSeek V4 Flash

DeepSeek · Text Generation
POST /v1/chat/completionsنموذج وزارة الوزن الخفيف الذي يبلغ مجموعه 284 باء/13 باء بارامترات ناشطة وسياق السكان الأصليين 1M، مخصوماً من الاستخدام المنخفض البطيء والفعال من حيث التكلفة من حيث التجانس.
في لمحة
| الميدان | القيمة |
|---|---|
| النموذج | deepseek-v4-flash |
| تاريخ الإفراج النموذجي | 2026-04-24 |
| طرائق المدخلات | النص |
| طرائق النواتج | النص |
| نافذة السياق | 1M |
| دقة الوزن | - |
| الحد الأقصى للنواتج | 393,216 |
| المنطقة | ألمانيا |
| المعالم | المنطق |
| Native inference | لا |
| جديدة | نعم |
| نقاط النهاية المدعومة | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
الطباعة
| الرسم | Spec | المعدل |
|---|---|---|
| الناتج | 1M | $0.14 |
| الناتج | 1M المولدة | $0.28 |
| البحث على شبكة الإنترنت (Linkup) | عند التذرع | $0.013 |
طلب مثال
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "deepseek-v4-flash", "messages": [{"role":"user","content":"Hello"}]}'
البارامترات
| البارامترات | النوع | المطلوبة | التقصير | الوصف |
|---|---|---|---|---|
temperature | العدد | لا | 0.7 | درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2 |
top_p | العدد | لا | 0.9 | نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1 |
max_tokens | العدد | لا | 4096 | الحد الأقصى للناتج الرنج: 1 - 393216 |
stop | سلسلة | لا | - | حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور |
enable_thinking | boolean | لا | صحيح | فعل step-by-step المنطق قبل الإجابة. |
thinking_budget | العدد | لا | 32768 | الحد الأقصى للقطع المحجوزة لعملية التعليل حتى 393216 الرنج: 1 - 393216 |
reasoning_effort | enum | لا | "medium" | مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: none، low، medium، high، max |
web_search_linkup | boolean | لا | كاذب | بحث ويب اختياري مدعوم من لينك أب. عند تفعيلها، يتم استرجاع مصادر الويب الحديثة باستخدام رسالة المستخدم الأخيرة كاستعلام وتقديمها للنموذج كسياق إضافي. يضيف $0.013 ثابتة لكل طلب بالإضافة إلى تكلفة الرمز العادية للنموذج. معطلة بشكل افتراضي. |
disable_formatting | boolean | لا | كاذب | عند تفعيلها، لا تضم البوابة تذيل “المصادر” إلى ردود المساعدين التي استخدمت Linkup البحث على الويب. مفيد عندما يتم نقل مخرج النموذج إلى نظام آخر لا يتوقع أي زخرفة. |
المتغيرات
:variant1
| الميدان | القيمة |
|---|---|
| النموذج | deepseek-v4-flash:variant1 |
| تاريخ الإفراج النموذجي | 2026-04-24 |
| المنطقة | سنغافورة |
| نافذة السياق | 1M |
| دقة الوزن | - |
| الحد الأقصى للنواتج | 393,216 |
| المعالم | التعليل، البحث على شبكة الإنترنت |
| Native inference | لا |
| نقاط النهاية المدعومة | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
** تسعير**
| الرسم | Spec | المعدل |
|---|---|---|
| الناتج | 1M | $0.20 |
| الناتج | 1M المولدة | $0.40 |
| البحث على شبكة الإنترنت | حسب الطلب | $0.02 |
** بارامترات**
| البارامترات | النوع | المطلوبة | التقصير | الوصف |
|---|---|---|---|---|
temperature | العدد | لا | 0.7 | درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2 |
top_p | العدد | لا | 0.9 | نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1 |
max_tokens | العدد | لا | 4096 | الحد الأقصى للناتج الرنج: 1 - 393216 |
stop | سلسلة | لا | - | حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور |
enable_thinking | boolean | لا | صحيح | فعل step-by-step المنطق قبل الإجابة. |
thinking_budget | العدد | لا | 32768 | الحد الأقصى للقطع المحجوزة لعملية التعليل حتى 393216 الرنج: 1 - 393216 |
reasoning_effort | enum | لا | "medium" | مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: none، low، medium، high، max |
tool_web_search | boolean | لا | كاذب | فعل البحث المباشر على الويب. تضيف رسوما إضافية $0.02 إلى تكلفة الطلب عند تفعيلها. |
:variant2
| الميدان | القيمة |
|---|---|
| النموذج | deepseek-v4-flash:variant2 |
| تاريخ الإفراج النموذجي | 2026-04-24 |
| المنطقة | الصين |
| نافذة السياق | 1M |
| دقة الوزن | - |
| الحد الأقصى للنواتج | 384,000 |
| المعالم | التعليل، الوظيفة |
| Native inference | لا |
| نقاط النهاية المدعومة | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
** تسعير**
| الرسم | Spec | المعدل |
|---|---|---|
| الناتج | 1M | $0.138 (كان $0.14) |
| الناتج | 1M المولدة | $0.275 (كان $0.28) |
| يُقرأ المخبأ | 1M cached input tokens | $0.028 |
| البحث على شبكة الإنترنت | حسب الطلب | $0.01 |
** بارامترات**
| البارامترات | النوع | المطلوبة | التقصير | الوصف |
|---|---|---|---|---|
temperature | العدد | لا | 0.7 | درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2 |
top_p | العدد | لا | 0.9 | نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1 |
max_tokens | العدد | لا | 4096 | الحد الأقصى للناتج الرنج: 1 - 393216 |
stop | سلسلة | لا | - | حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور |
enable_thinking | boolean | لا | صحيح | فعل step-by-step المنطق قبل الإجابة. |
thinking_budget | العدد | لا | 32768 | الحد الأقصى للقطع المحجوزة لعملية التعليل حتى 393216 الرنج: 1 - 393216 |
reasoning_effort | enum | لا | "medium" | مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: none، low، medium، high، max |
tool_web_search | boolean | لا | كاذب | فعل البحث المباشر على الويب. يضيف $0.01 إلى تكلفة الطلب عند تفعيله. |
مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-flash.
