DeepSeek V4 Pro | EmpirioLabs AI Docs

DeepSeek · Text Generation

POST /v1/chat/completions

1.6T कुल/49B सक्रिय मापदंडों के साथ फ्लैगशिप MoE LLM और उन्नत गणित, तार्किक अनुमान और विशेष कोडिंग के लिए मूल 1M संदर्भ।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`deepseek-v4-pro`
मॉडल रिलीज की तारीख	2026-04-24
इनपुट तौर-तरीके	टेक्स्ट
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	393,216
क्षेत्र	जर्मनी
सुविधाऐं	तर्कपूर्ण आधार
मूल अनुमान	नहीं
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$1.65 ($1.74 था)
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$3.30 ($3.48 था)
वेब खोज (Linkup)	प्रति कॉल जब लागू किया जाता है	$0.013

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "deepseek-v4-pro", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले step-by-step तर्क सक्षम करें।
`thinking_budget`	संख्या	नहीं	`32768`	रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`web_search_linkup`	बूलियन	नहीं	गलत	लिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
`disable_formatting`	बूलियन	नहीं	गलत	सक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

विकल्प

`:variant1`

फ़ील्ड	मूल्य
मॉडल आईडी	`deepseek-v4-pro:variant1`
मॉडल रिलीज की तारीख	2026-04-24
क्षेत्र	सिंगापुर
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	393,216
सुविधाऐं	रीजनिंग, web_search
मूल अनुमान	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$2.40
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$4.80
वेब खोज	सक्षम होने पर प्रति अनुरोध	$0.02

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले step-by-step तर्क सक्षम करें।
`thinking_budget`	संख्या	नहीं	`32768`	रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`tool_web_search`	बूलियन	नहीं	गलत	लाइव वेब खोज सक्षम करें। सक्षम होने पर अनुरोध लागत में $0.02 अधिभार जोड़ता है।

`:variant2`

फ़ील्ड	मूल्य
मॉडल आईडी	`deepseek-v4-pro:variant2`
मॉडल रिलीज की तारीख	2026-04-24
क्षेत्र	चीन
संदर्भ विंडो	1 मी
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	384,000
सुविधाऐं	रीजनिंग, function_calling, web_search, कैश
मूल अनुमान	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$1.65 ($1.74 था)
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$3.301 ($3.48 था)
अंतर्निहित कैश पढ़ा गया	प्रति 1M कैश्ड इनपुट टोकन	$0.138
वेब खोज	सक्षम होने पर प्रति अनुरोध	$0.01

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 393216
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`enable_thinking`	बूलियन	नहीं	सच	उत्तर देने से पहले step-by-step तर्क सक्षम करें।
`thinking_budget`	संख्या	नहीं	`32768`	रीजनिंग प्रक्रिया के लिए आरक्षित अधिकतम टोकन। 393216 तक। · रेंज: 1 - 393216
`reasoning_effort`	एनम	नहीं	`"medium"`	तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: `none`, `low`, `medium`, `high`, `max`
`tool_web_search`	बूलियन	नहीं	गलत	लाइव वेब खोज सक्षम करें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-pro।