DeepSeek V4 Pro

DeepSeek V4 Pro
DeepSeek · Text Generation
POST /v1/chat/completions

Flaggschiff-MoE-LLM mit insgesamt 1,6T / 49B aktiven Parametern und nativem 1M-Kontext für fortgeschrittene Mathematik, logische Inferenz und spezialisierte Programmierung.

Auf einen Blick

SpielfeldWert
Modell-IDdeepseek-v4-pro
Modell-Veröffentlichungsdatum2026-04-24
EingabemodalitätenText
AusgabemodalitätenText
Kontextfenster1M
Gewichtspräzision-
Maximale Ausgabetoken393,216
RegionDeutschland
MerkmaleBegründung
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$1.65 (war $1.74)
Ausgabepro 1 Million generierter Token$3.30 (war $3.48)
Websuche (Linkup)pro Aufruf beim Aufruf$0.013

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "deepseek-v4-pro", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 393216
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
enable_thinkingBooleanNeinStimmtAktiviere step-by-step Argumentation, bevor du antwortest.
thinking_budgetAnzahlNein32768Maximale Token, die für den Schlussfolgerungsprozess reserviert sind. Bis 393216. · Reichweite: 1 – 393216
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max
web_search_linkupBooleanNeinfalschOptionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
disable_formattingBooleanNeinfalschWenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Varianten

:variant1

SpielfeldWert
Modell-IDdeepseek-v4-pro:variant1
Modell-Veröffentlichungsdatum2026-04-24
RegionSingapur
Kontextfenster1M
Gewichtspräzision-
Maximale Ausgabetoken393,216
MerkmaleBegründung, web_search
Native SchlussfolgerungNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$2.40
Ausgabepro 1 Million generierter Token$4.80
Websuchepro Anfrage, wenn aktiviert$0.02

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 393216
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
enable_thinkingBooleanNeinStimmtAktiviere step-by-step Argumentation, bevor du antwortest.
thinking_budgetAnzahlNein32768Maximale Token, die für den Schlussfolgerungsprozess reserviert sind. Bis 393216. · Reichweite: 1 – 393216
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max
tool_web_searchBooleanNeinfalschAktivieren Sie die Live-Websuche. Fügt beim Aktivieren eine $0.02 Zuschlag auf die Anfragekosten hinzu.

:variant2

SpielfeldWert
Modell-IDdeepseek-v4-pro:variant2
Modell-Veröffentlichungsdatum2026-04-24
RegionChina
Kontextfenster1M
Gewichtspräzision-
Maximale Ausgabetoken384,000
MerkmaleBegründung, function_calling, web_search, Cache
Native SchlussfolgerungNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$1.65 (war $1.74)
Ausgabepro 1 Million generierter Token$3.301 (war $3.48)
Implizite Cache-Leseartpro 1M zwischengespeicherten Eingabetoken$0.138
Websuchepro Anfrage, wenn aktiviert$0.01

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 393216
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
enable_thinkingBooleanNeinStimmtAktiviere step-by-step Argumentation, bevor du antwortest.
thinking_budgetAnzahlNein32768Maximale Token, die für den Schlussfolgerungsprozess reserviert sind. Bis 393216. · Reichweite: 1 – 393216
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max
tool_web_searchBooleanNeinfalschAktivieren Sie die Live-Websuche. Das erhöht $0.01 auf die Anforderungskosten, wenn es aktiviert ist.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-pro.