MiMo V2 Flash

POST /v1/chat/completionsModèle de raisonnement léger et rapide avec attention hybride et prédiction multi-jetons pour une inférence à faible coût et des scores de benchmark solides.
En un coup d’œil
Tarification
Exemple de demande
Paramètres
Notes
Niveau de contexte 256K léger. La recherche web ($0.015/call) n’est facturée qu’en cas d’invocation. Les jetons d’entrée en cache sont facturés à un prix fortement réduit.
Facturation par outil (usage.tool_usage)
Lorsque ce modèle invoque des outils (recherche web, interpréteur de code, etc.) dans une seule requête, la réponse porte une carte de usage.tool_usage normalisée à côté des comptes de tokens. L’exemple ci-dessous montre la forme - les noms exacts des champs, les unités et les outils qui apparaissent peuvent varier légèrement selon le fournisseur:
Le nombre d’outils est déjà pris en compte dans cost_usd - ils sont présentés pour la transparence afin que vous puissiez auditer la facturation par outil. Le champ est omis lorsqu’aucun outil n’a été invoqué.
_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/mimo-v2-flash.
