DeepSeek V4 Pro

DeepSeek V4 Pro
DeepSeek · Text Generation
POST /v1/chat/completions

1.6T कुल/49B सक्रिय मापदंडों के साथ फ्लैगशिप MoE LLM और उन्नत गणित, तार्किक अनुमान और विशेष कोडिंग के लिए मूल 1M संदर्भ।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीdeepseek-v4-pro
मॉडल रिलीज की तारीख2026-04-24
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन393,216
क्षेत्रजर्मनी
सुविधाऐंतर्कपूर्ण आधार
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$1.65 ($1.74 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन$3.30 ($3.48 था)
वेब खोज (Linkup)प्रति कॉल जब लागू किया जाता है$0.013

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "deepseek-v4-pro", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले step-by-step तर्क सक्षम करें।
thinking_budgetसंख्यानहीं32768रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
web_search_linkupबूलियननहींगलतलिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
disable_formattingबूलियननहींगलतसक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

विकल्प

:variant1

फ़ील्डमूल्य
मॉडल आईडीdeepseek-v4-pro:variant1
मॉडल रिलीज की तारीख2026-04-24
क्षेत्रसिंगापुर
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन393,216
सुविधाऐंरीजनिंग, web_search
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$2.40
उत्पादनप्रति 1M जेनरेट किए गए टोकन$4.80
वेब खोजसक्षम होने पर प्रति अनुरोध$0.02

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले step-by-step तर्क सक्षम करें।
thinking_budgetसंख्यानहीं32768रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
tool_web_searchबूलियननहींगलतलाइव वेब खोज सक्षम करें। सक्षम होने पर अनुरोध लागत में $0.02 अधिभार जोड़ता है।

:variant2

फ़ील्डमूल्य
मॉडल आईडीdeepseek-v4-pro:variant2
मॉडल रिलीज की तारीख2026-04-24
क्षेत्रचीन
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन384,000
सुविधाऐंरीजनिंग, function_calling, web_search, कैश
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$1.65 ($1.74 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन$3.301 ($3.48 था)
अंतर्निहित कैश पढ़ा गयाप्रति 1M कैश्ड इनपुट टोकन$0.138
वेब खोजसक्षम होने पर प्रति अनुरोध$0.01

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले step-by-step तर्क सक्षम करें।
thinking_budgetसंख्यानहीं32768रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
tool_web_searchबूलियननहींगलतलाइव वेब खोज सक्षम करें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-pro