MiniMax M2.7 Highspeed

MiniMax M2.7 Highspeed
MiniMax · Text Generation
POST /v1/chat/completions

Hochgeschwindigkeits-M2.7-Variante, abgestimmt für schnelle Inferenz mit starker Allzweckleistung und starken agentischen Fähigkeiten.

Auf einen Blick

SpielfeldWert
Modell-IDminimax-m2-7-highspeed
Modell-Veröffentlichungsdatum2026-03-18
EingabemodalitätenText
AusgabemodalitätenText
Kontextfenster200K
Gewichtspräzision-
Maximale Ausgabetoken32,768
RegionSingapur
MerkmaleBegründung
Native SchlussfolgerungNein
NeuNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$0.30 (war $0.60)
Ausgabepro 1 Million generierter Token$1.20 (war $2.40)
Implizite Cache-Leseartpro 1M zwischengespeicherten Eingabetoken$0.03 (war $0.06)
Websuche (Linkup)pro Aufruf beim Aufruf$0.013

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m2-7-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein1.0Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.95Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Token in der Antwort. · Reichweite: 1 – 131072
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
toolsAnordnungNein-OpenAI-ähnliche Definitionen von funktionsaufrufenden Werkzeugen. Jeder Eintrag enthält Namen, Beschreibung und Parameter.
tool_choiceStringNein-Auto | Keine | Erforderlich | {Typ:Funktion, Funktion:{Name:”…”}}. Kontrolliert, wann das Modell ein Werkzeug aufrufen muss.
web_search_linkupBooleanNeinfalschOptionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
disable_formattingBooleanNeinfalschWenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Anmerkungen

Gleiche Frontier-Leistung wie das M2.7 mit ~100 tokens/sec Ausgabe. Interleaved-Denken ist immer aktiviert (kein Schalter).


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/minimax-m2-7-highspeed.