MiMo V2.5 | EmpirioLabs AI Docs

Xiaomi · Text Generation

POST /v1/chat/completions

Modèle multimodal avec compréhension visuelle et audio native dans un contexte 1M, conçu pour raisonner et agir à travers différentes modalités dans des flux de travail agentiques.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`mimo-v2-5`
Date de sortie du modèle	2026-04-22
Modalités d’entrée	Texte, Image, Vidéo, Audio
Modalités de sortie	Texte
Fenêtre de contexte	1M
Précision du poids	-
Jetons de sortie max	128,000
Caractéristiques	vision, audio_in
Inférence autochtone	Non
Nouveau	Oui
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	$0.70
Production	par 1M de jetons générés	$1.40
Lecture implicite du cache	par 1M de jetons d’entrée mis en cache	$0.014
Recherche Web	par appel	$0.015

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "mimo-v2-5", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`enable_thinking`	Booléen	non	Vrai	Activez le mode pensée étendue. Plus lent, mais améliore les tâches qui demandent beaucoup de raisonnement.
`tool_web_search`	Booléen	non	faux	Permettre au modèle d’effectuer des recherches web lorsque cela est nécessaire.
`web_search_force`	Booléen	non	faux	Forcez le modèle à toujours effectuer une recherche web avant de répondre.
`web_search_max_keyword`	Nombre	non	`3`	Nombre maximal de mots-clés que le modèle peut utiliser dans les recherches web. · Répartition: 1 – 5
`web_search_limit`	Nombre	non	`5`	Nombre maximal de recherches web que le modèle peut effectuer par requête. · Répartition: 1 – 10
`video_fps`	Nombre	non	`2`	Images par seconde échantillonnées à partir de la vidéo d’entrée pour analyse. · Plage: 0,1 – 10
`video_resolution`	enum	non	`"default"`	Résolution à laquelle la vidéo d’entrée est échantillonnée (par exemple 360p, 480p, 720p). · Autorisé: `default`, `max`
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
`top_p`	Nombre	non	`0.9`	Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Maximum de jetons dans la réponse. · Répartition: 1 – 65536
`stop`	Corde	non	-	Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
`disable_formatting`	Booléen	non	faux	Passez le format EmpirioLabs Markdown (citation [N] réécriture + bloc Références lorsque la recherche web a été utilisée). La réponse brute en amont avec des citations simples [N] est retournée.

Notes

Entrée omnimodale (texte, image, vidéo, audio) avec sortie texte. La recherche web ($0.015/call) n’est facturée qu’en cas d’invocation. Les jetons d’entrée en cache sont facturés à un prix fortement réduit.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils (recherche web, interpréteur de code, etc.) dans une seule requête, la réponse porte une carte de usage.tool_usage normalisée à côté des comptes de tokens. L’exemple ci-dessous montre la forme - les noms exacts des champs, les unités et les outils qui apparaissent peuvent varier légèrement selon le fournisseur:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

Le nombre d’outils est déjà pris en compte dans cost_usd - ils sont présentés pour la transparence afin que vous puissiez auditer la facturation par outil. Le champ est omis lorsqu’aucun outil n’a été invoqué.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/mimo-v2-5.