DeepSeek V3.2 | EmpirioLabs AI Docs

DeepSeek · Text Generation

POST /v1/chat/completions

LLM open source Mixture-of-Experts, adapté pour un raisonnement efficace, du codage et des tâches générales de langage à travers des prompts longs.

This model is deprecated and will be retired on 2026-07-08. After that date, requests to this model will fail. Migrate to a successor model before then.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`deepseek-v3-2`
Date de sortie du modèle	2025-12-01
Modalités d’entrée	Texte
Modalités de sortie	Texte
Fenêtre de contexte	128K
Précision du poids	-
Jetons de sortie max	32,768
Région	Singapour
Caractéristiques	Raisonnement
Inférence autochtone	Non
Nouveau	Non
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`
Date de dépréciation	2026-07-08

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	$0.57
Production	par 1M de jetons générés	$1.71
Recherche Web	par appel	$0.015

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "deepseek-v3-2", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage · Plage: 0 – 2
`top_p`	Nombre	non	`0.9`	Échantillonnage du noyau · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Jetons de sortie max · Répartition: 1 – 65536
`enable_thinking`	Booléen	non	Vrai	Activez step-by-step raisonnement avant de répondre.
`thinking_budget`	Nombre	non	`32768`	Le maximum de jetons est réservé au processus de raisonnement. Jusqu’à 393216. · Répartition: 1 – 393216
`reasoning_effort`	enum	non	`"medium"`	Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: `none`, `low`, `medium`, `high`, `max`
`enable_search`	Booléen	non	faux	Autorisez la recherche web en temps réel. Facturé uniquement lorsque le fournisseur signale l’utilisation de la recherche.

Notes

Les appels de recherche web coûtent $0.015 chacun - ils ne sont facturés qu’en cas d’invocation. Les jetons de raisonnement (CoT) facturent comme jetons de sortie.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/deepseek-v3-2.