Mistral Small 4

Mistral Small 4
Mistral AI · Text Generation
POST /v1/chat/completions

Modèle hybride unifiant les familles Instruct, Raisonnement (Magistral) et Devstral: 40 % de temps d’achèvement inférieur et débit 3x supérieur à Petit 3.

En un coup d’œil

TerrainValeur
Identifiant de modèlemistral-small-4
Date de sortie du modèle2026-03-16
Modalités d’entréeTexte, Image
Modalités de sortieTexte
Fenêtre de contexte256K
Précision du poids-
Jetons de sortie max65,536
CaractéristiquesVision
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.15
Productionpar 1M de jetons générés$0.60
Recherche Web standardpar appel$0.084
Recherche Web Premiumpar appel$0.140
Interpréteur de codepar appel$0.084
Génération d’imagespar image$0.280

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "mistral-small-4", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
reasoning_enabledBooléennonVraiActivez le raisonnement étendu (mappé en raisonnement: élevé|aucun)
tool_web_searchBooléennonVraiActiver web_search outil
web_search_tierenumnon"standard"Niveau de recherche web standard ou premium. Premium utilise des sources de meilleure qualité. · Autorisé: standard, premium
tool_code_interpreterBooléennonVraiPermettre au modèle d’exécuter du code Python dans un bac à sable pour calculer / analyser des données.
tool_image_generationBooléennonVraiPermettre au modèle de générer des images en ligne via l’outil de génération d’images de la plateforme.
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 1,5
max_tokensNombrenon4096Maximum de jetons dans la réponse. · Répartition: 1 – 32768
disable_formattingBooléennonfauxÉvitez la mise en forme Markdown d’EmpirioLabs (citation [N] réécriture + bloc Références lorsque l’outil web_search a été utilisé). La réponse brute en amont avec des citations simples [N] est retournée.

Notes

Les outils (recherche web, interpréteur de code, génération d’images) ne sont facturés que lorsqu’ils sont effectivement invoqués.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils intégrés (recherche web, interpréteur de code, etc.) dans une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de jetons. L’exemple ci-dessous montre la forme - les noms exacts des champs, les unités et les outils qui apparaissent peuvent varier légèrement selon le fournisseur:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

Le nombre d’outils est déjà pris en compte dans cost_usd - ils sont présentés pour la transparence afin que vous puissiez auditer la facturation par outil. Le champ est omis lorsqu’aucun outil n’a été invoqué.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/mistral-small-4.