DeepSeek V3.2

DeepSeek V3.2
DeepSeek · Text Generation
POST /v1/chat/completions

LLM open source Mixture-of-Experts, adapté pour un raisonnement efficace, du codage et des tâches générales de langage à travers des prompts longs.

This model is deprecated and will be retired on 2026-07-08. After that date, requests to this model will fail. Migrate to a successor model before then.

En un coup d’œil

TerrainValeur
Identifiant de modèledeepseek-v3-2
Date de sortie du modèle2025-12-01
Modalités d’entréeTexte
Modalités de sortieTexte
Fenêtre de contexte128K
Précision du poids-
Jetons de sortie max32,768
RégionSingapour
CaractéristiquesRaisonnement
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages
Date de dépréciation2026-07-08

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.57
Productionpar 1M de jetons générés$1.71
Recherche Webpar appel$0.015

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "deepseek-v3-2", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage · Plage: 0 – 2
top_pNombrenon0.9Échantillonnage du noyau · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie max · Répartition: 1 – 65536
enable_thinkingBooléennonVraiActivez step-by-step raisonnement avant de répondre.
thinking_budgetNombrenon32768Le maximum de jetons est réservé au processus de raisonnement. Jusqu’à 393216. · Répartition: 1 – 393216
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max
enable_searchBooléennonfauxAutorisez la recherche web en temps réel. Facturé uniquement lorsque le fournisseur signale l’utilisation de la recherche.

Notes

Les appels de recherche web coûtent $0.015 chacun - ils ne sont facturés qu’en cas d’invocation. Les jetons de raisonnement (CoT) facturent comme jetons de sortie.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/deepseek-v3-2.