MiniMax M3

MiniMax · Text Generation

POST /v1/chat/completions

MiniMax M3 est un modèle de raisonnement multimodal pour le codage, les agents et l’analyse en contexte long avec saisie texte, image et vidéo.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`minimax-m3`
Date de sortie du modèle	2026-06-01
Modalités d’entrée	Texte, Image, Vidéo
Modalités de sortie	Texte
Fenêtre de contexte	524K
Précision du poids	-
Jetons de sortie max	524,288
Région	Singapour
Caractéristiques	Raisonnement, vision, vidéo, web_search, function_calling, cache, long_context
Inférence autochtone	Non
Nouveau	Oui
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	<=512K $0.225 (était $0.30); >512K $1.20
Production	par 1M de jetons générés	<=512K $0.90 (était $1.20); >512K $4.80
Lecture implicite du cache	par 1M de jetons d’entrée mis en cache	<=512K $0.045 (était $0.06); >512K $0.24
Recherche web Linkup	par recherche réussie lorsqu’elle est activée	$0.013

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "minimax-m3", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`1`	Contrôle l’aléatoire. Les valeurs inférieures sont plus déterministes; Les valeurs plus élevées sont plus exploratoires. · Plage: 0 – 2
`top_p`	Nombre	non	`0.95`	Contrôle l’échantillonnage du noyau en limitant la génération à la masse token la plus probable. · Répartition: 0 – 1
`max_completion_tokens`	entier	non	`4096`	Maximum de jetons générés, y compris les jetons de raisonnement lorsque la réflexion est activée. · Répartition: 1 – 524288
`stop`	Tableau	non	-	Séquence d’arrêts optionnelle ou liste de séquences d’arrêts.
`enable_thinking`	Booléen	non	Vrai	Activez la pensée modélistique adaptative avant de répondre. Réglez false pour demander une réponse directe sans phase de raisonnement.
`web_search_linkup`	Booléen	non	faux	Recherchez sur Internet des informations récentes avec Linkup avant les réponses du MiniMax M3. Ajoute $0.013 aux requêtes réussies lorsqu’elles sont activées.
`tools`	Tableau	non	-	Définitions d’outils compatibles OpenAI pour l’appel de fonctions.
`tool_choice`	Objet	non	-	Option compatible OpenAI tool_choice valeur.

Notes

Entrée texte, image et vidéo avec sortie texte. La pensée passe par défaut à l’adaptatif et peut être désactivée. La tarification est basée sur les jetons d’entrée, y compris les impacts du cache: <=512K utilise le niveau standard réduit, tandis que >512K utilise le niveau à contexte élevé. La route standard actuelle prend en charge jusqu’à 524K tokens. Le contexte 1M est en train de se déployer. La recherche web Linkup est disponible via web_search_linkup et ajoute $0.013 par recherche réussie.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/minimax-m3.