DeepSeek V4 Flash

DeepSeek V4 Flash
DeepSeek · Text Generation
POST /v1/chat/completions

284B कुल/13B सक्रिय मापदंडों और मूल 1M संदर्भ के साथ हल्का MoE मॉडल, कम-विलंबता, लागत प्रभावी उच्च-समवर्ती उपयोग के लिए ट्यून किया गया।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीdeepseek-v4-flash
मॉडल रिलीज की तारीख2026-04-24
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन393,216
क्षेत्रजर्मनी
सुविधाऐंतर्कपूर्ण आधार
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.14
उत्पादनप्रति 1M जेनरेट किए गए टोकन$0.28
वेब खोज (Linkup)प्रति कॉल जब लागू किया जाता है$0.013

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "deepseek-v4-flash", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले step-by-step तर्क सक्षम करें।
thinking_budgetसंख्यानहीं32768रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
web_search_linkupबूलियननहींगलतलिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
disable_formattingबूलियननहींगलतसक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

विकल्प

:variant1

फ़ील्डमूल्य
मॉडल आईडीdeepseek-v4-flash:variant1
मॉडल रिलीज की तारीख2026-04-24
क्षेत्रसिंगापुर
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन393,216
सुविधाऐंरीजनिंग, web_search
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.20
उत्पादनप्रति 1M जेनरेट किए गए टोकन$0.40
वेब खोजसक्षम होने पर प्रति अनुरोध$0.02

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले step-by-step तर्क सक्षम करें।
thinking_budgetसंख्यानहीं32768रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
tool_web_searchबूलियननहींगलतलाइव वेब खोज सक्षम करें। सक्षम होने पर अनुरोध लागत में $0.02 अधिभार जोड़ता है।

:variant2

फ़ील्डमूल्य
मॉडल आईडीdeepseek-v4-flash:variant2
मॉडल रिलीज की तारीख2026-04-24
क्षेत्रचीन
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन384,000
सुविधाऐंरीजनिंग, function_calling, web_search, कैश
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.138 ($0.14 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन$0.275 ($0.28 था)
अंतर्निहित कैश पढ़ा गयाप्रति 1M कैश्ड इनपुट टोकन$0.028
वेब खोजसक्षम होने पर प्रति अनुरोध$0.01

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले step-by-step तर्क सक्षम करें।
thinking_budgetसंख्यानहीं32768रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
tool_web_searchबूलियननहींगलतलाइव वेब खोज सक्षम करें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-flash