DeepSeek V4 Pro

DeepSeek V4 Pro
DeepSeek · Text Generation
POST /v1/chat/completions

LLM MoE phare avec 1,6T au total / 49B de paramètres actifs et un contexte natif 1M pour les mathématiques avancées, l’inférence logique et le codage spécialisé.

En un coup d’œil

TerrainValeur
Identifiant de modèledeepseek-v4-pro
Date de sortie du modèle2026-04-24
Modalités d’entréeTexte
Modalités de sortieTexte
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max393,216
RégionAllemagne
CaractéristiquesRaisonnement
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$1.65 (était $1.74)
Productionpar 1M de jetons générés$3.30 (était $3.48)
Recherche Web (Linkup)par appel lors de l’invocation$0.013

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "deepseek-v4-pro", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie maximum. · Répartition: 1 – 393216
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_thinkingBooléennonVraiActivez step-by-step raisonnement avant de répondre.
thinking_budgetNombrenon32768Le maximum de jetons est réservé au processus de raisonnement. Jusqu’à 393216. · Répartition: 1 – 393216
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max
web_search_linkupBooléennonfauxRecherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
disable_formattingBooléennonfauxUne fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

Variantes

:variant1

TerrainValeur
Identifiant de modèledeepseek-v4-pro:variant1
Date de sortie du modèle2026-04-24
RégionSingapour
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max393,216
Caractéristiquesraisonnement, web_search
Inférence autochtoneNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Prix

ChargeSpecTaux
Entréepar 1M de jetons d’invite$2.40
Productionpar 1M de jetons générés$4.80
Recherche webpar requête lorsqu’activé$0.02

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie maximum. · Répartition: 1 – 393216
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_thinkingBooléennonVraiActivez step-by-step raisonnement avant de répondre.
thinking_budgetNombrenon32768Le maximum de jetons est réservé au processus de raisonnement. Jusqu’à 393216. · Répartition: 1 – 393216
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max
tool_web_searchBooléennonfauxActivez la recherche web en direct. Ajoute une surcharge $0.02 au coût de la requête lorsqu’il est activé.

:variant2

TerrainValeur
Identifiant de modèledeepseek-v4-pro:variant2
Date de sortie du modèle2026-04-24
RégionChine
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max384,000
CaractéristiquesRaisonnement, function_calling, web_search, cache
Inférence autochtoneNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Prix

ChargeSpecTaux
Entréepar 1M de jetons d’invite$1.65 (était $1.74)
Productionpar 1M de jetons générés$3.301 (était $3.48)
Lecture implicite du cachepar 1M de jetons d’entrée mis en cache$0.138
Recherche webpar requête lorsqu’activé$0.01

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie maximum. · Répartition: 1 – 393216
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_thinkingBooléennonVraiActivez step-by-step raisonnement avant de répondre.
thinking_budgetNombrenon32768Le maximum de jetons est réservé au processus de raisonnement. Jusqu’à 393216. · Répartition: 1 – 393216
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max
tool_web_searchBooléennonfauxActivez la recherche web en direct. Ajoute $0.01 au coût de la requête lorsqu’il est activé.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/deepseek-v4-pro.