MiniMax M3

MiniMax M3
MiniMax · Text Generation
POST /v1/chat/completions

MiniMax M3 est un modèle de raisonnement multimodal pour le codage, les agents et l’analyse en contexte long avec saisie texte, image et vidéo.

En un coup d’œil

TerrainValeur
Identifiant de modèleminimax-m3
Date de sortie du modèle2026-06-01
Modalités d’entréeTexte, Image, Vidéo
Modalités de sortieTexte
Fenêtre de contexte524K
Précision du poids-
Jetons de sortie max524,288
RégionSingapour
CaractéristiquesRaisonnement, vision, vidéo, web_search, function_calling, cache, long_context
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite<=512K $0.225 (était $0.30); >512K $1.20
Productionpar 1M de jetons générés<=512K $0.90 (était $1.20); >512K $4.80
Lecture implicite du cachepar 1M de jetons d’entrée mis en cache<=512K $0.045 (était $0.06); >512K $0.24
Recherche web Linkuppar recherche réussie lorsqu’elle est activée$0.013

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m3", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon1Contrôle l’aléatoire. Les valeurs inférieures sont plus déterministes; Les valeurs plus élevées sont plus exploratoires. · Plage: 0 – 2
top_pNombrenon0.95Contrôle l’échantillonnage du noyau en limitant la génération à la masse token la plus probable. · Répartition: 0 – 1
max_completion_tokensentiernon4096Maximum de jetons générés, y compris les jetons de raisonnement lorsque la réflexion est activée. · Répartition: 1 – 524288
stopTableaunon-Séquence d’arrêts optionnelle ou liste de séquences d’arrêts.
enable_thinkingBooléennonVraiActivez la pensée modélistique adaptative avant de répondre. Réglez false pour demander une réponse directe sans phase de raisonnement.
web_search_linkupBooléennonfauxRecherchez sur Internet des informations récentes avec Linkup avant les réponses du MiniMax M3. Ajoute $0.013 aux requêtes réussies lorsqu’elles sont activées.
toolsTableaunon-Définitions d’outils compatibles OpenAI pour l’appel de fonctions.
tool_choiceObjetnon-Option compatible OpenAI tool_choice valeur.

Notes

Entrée texte, image et vidéo avec sortie texte. La pensée passe par défaut à l’adaptatif et peut être désactivée. La tarification est basée sur les jetons d’entrée, y compris les impacts du cache: <=512K utilise le niveau standard réduit, tandis que >512K utilise le niveau à contexte élevé. La route standard actuelle prend en charge jusqu’à 524K tokens. Le contexte 1M est en train de se déployer. La recherche web Linkup est disponible via web_search_linkup et ajoute $0.013 par recherche réussie.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/minimax-m3.