MiniMax M2.7 Highspeed | EmpirioLabs AI Docs

MiniMax · Text Generation

POST /v1/chat/completions

Hochgeschwindigkeits-M2.7-Variante, abgestimmt für schnelle Inferenz mit starker Allzweckleistung und starken agentischen Fähigkeiten.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`minimax-m2-7-highspeed`
Modell-Veröffentlichungsdatum	2026-03-18
Eingabemodalitäten	Text
Ausgabemodalitäten	Text
Kontextfenster	200K
Gewichtspräzision	-
Maximale Ausgabetoken	32,768
Region	Singapur
Merkmale	Begründung
Native Schlussfolgerung	Nein
Neu	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$0.30 (war $0.60)
Ausgabe	pro 1 Million generierter Token	$1.20 (war $2.40)
Implizite Cache-Leseart	pro 1M zwischengespeicherten Eingabetoken	$0.03 (war $0.06)
Websuche (Linkup)	pro Aufruf beim Aufruf	$0.013

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "minimax-m2-7-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`1.0`	Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.95`	Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Token in der Antwort. · Reichweite: 1 – 131072
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`tools`	Anordnung	Nein	-	OpenAI-ähnliche Definitionen von funktionsaufrufenden Werkzeugen. Jeder Eintrag enthält Namen, Beschreibung und Parameter.
`tool_choice`	String	Nein	-	Auto \| Keine \| Erforderlich \| {Typ:Funktion, Funktion:{Name:”…”}}. Kontrolliert, wann das Modell ein Werkzeug aufrufen muss.
`web_search_linkup`	Boolean	Nein	falsch	Optionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
`disable_formatting`	Boolean	Nein	falsch	Wenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Anmerkungen

Gleiche Frontier-Leistung wie das M2.7 mit ~100 tokens/sec Ausgabe. Interleaved-Denken ist immer aktiviert (kein Schalter).

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/minimax-m2-7-highspeed.