Mistral Small 4

Mistral AI · Text Generation

POST /v1/chat/completions

Modèle hybride unifiant les familles Instruct, Raisonnement (Magistral) et Devstral: 40 % de temps d’achèvement inférieur et débit 3x supérieur à Petit 3.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`mistral-small-4`
Date de sortie du modèle	2026-03-16
Modalités d’entrée	Texte, Image
Modalités de sortie	Texte
Fenêtre de contexte	256K
Précision du poids	-
Jetons de sortie max	65,536
Caractéristiques	Vision
Inférence autochtone	Non
Nouveau	Non
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	$0.15
Production	par 1M de jetons générés	$0.60
Recherche Web standard	par appel	$0.084
Recherche Web Premium	par appel	$0.140
Interpréteur de code	par appel	$0.084
Génération d’images	par image	$0.280

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "mistral-small-4", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`reasoning_enabled`	Booléen	non	Vrai	Activez le raisonnement étendu (mappé en raisonnement: élevé\|aucun)
`tool_web_search`	Booléen	non	Vrai	Activer web_search outil
`web_search_tier`	enum	non	`"standard"`	Niveau de recherche web standard ou premium. Premium utilise des sources de meilleure qualité. · Autorisé: `standard`, `premium`
`tool_code_interpreter`	Booléen	non	Vrai	Permettre au modèle d’exécuter du code Python dans un bac à sable pour calculer / analyser des données.
`tool_image_generation`	Booléen	non	Vrai	Permettre au modèle de générer des images en ligne via l’outil de génération d’images de la plateforme.
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 1,5
`max_tokens`	Nombre	non	`4096`	Maximum de jetons dans la réponse. · Répartition: 1 – 32768
`disable_formatting`	Booléen	non	faux	Évitez la mise en forme Markdown d’EmpirioLabs (citation [N] réécriture + bloc Références lorsque l’outil web_search a été utilisé). La réponse brute en amont avec des citations simples [N] est retournée.

Notes

Les outils (recherche web, interpréteur de code, génération d’images) ne sont facturés que lorsqu’ils sont effectivement invoqués.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils intégrés (recherche web, interpréteur de code, etc.) dans une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de jetons. L’exemple ci-dessous montre la forme - les noms exacts des champs, les unités et les outils qui apparaissent peuvent varier légèrement selon le fournisseur:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

Le nombre d’outils est déjà pris en compte dans cost_usd - ils sont présentés pour la transparence afin que vous puissiez auditer la facturation par outil. Le champ est omis lorsqu’aucun outil n’a été invoqué.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/mistral-small-4.