MiniMax M2.7 Highspeed

MiniMax M2.7 Highspeed
MiniMax · Text Generation
POST /v1/chat/completions

Variante M2.7 à grande vitesse réglée pour une inférence rapide, avec de fortes performances polyvalentes et de fortes capacités agentiques.

En un coup d’œil

TerrainValeur
Identifiant de modèleminimax-m2-7-highspeed
Date de sortie du modèle2026-03-18
Modalités d’entréeTexte
Modalités de sortieTexte
Fenêtre de contexte200K
Précision du poids-
Jetons de sortie max32,768
RégionSingapour
CaractéristiquesRaisonnement
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.30 (était $0.60)
Productionpar 1M de jetons générés$1.20 (était $2.40)
Lecture implicite du cachepar 1M de jetons d’entrée mis en cache$0.03 (était $0.06)
Recherche Web (Linkup)par appel lors de l’invocation$0.013

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m2-7-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon1.0Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.95Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Maximum de jetons dans la réponse. · Répartition: 1 – 131072
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
toolsTableaunon-Définitions d’outils d’appel de fonction à la manière OpenAI. Chaque entrée a un nom, une description, des paramètres.
tool_choiceCordenon-auto | aucun | obligatoire | {type:fonction, fonction:{nom: »…”}}. Contrôle quand le modèle doit appeler un outil.
web_search_linkupBooléennonfauxRecherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
disable_formattingBooléennonfauxUne fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

Notes

Même performance de frontière que le M2.7 avec ~100 tokens/sec de sortie. La pensée entrelacée est toujours activée (pas de bascule).


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/minimax-m2-7-highspeed.