MiniMax M2.7

MiniMax M2.7
MiniMax · Text Generation
POST /v1/chat/completions

MiniMax M2.7 ist ein allgemeines Denk-Chat-Modell mit verflokenem Denken, Funktionsaufrufen und promptem Caching.

Auf einen Blick

SpielfeldWert
Modell-IDminimax-m2-7
Modell-Veröffentlichungsdatum2026-03-18
EingabemodalitätenText
AusgabemodalitätenText
Kontextfenster200K
Gewichtspräzision-
Maximale Ausgabetoken32,768
RegionSingapur
MerkmaleBegründung, function_calling, Cache
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$0.15 (war $0.30)
Ausgabepro 1 Million generierter Token$0.60 (war $1.20)
Implizite Cache-Leseartpro 1M zwischengespeicherten Eingabetoken$0.03 (war $0.06)
Websuche (Linkup)pro Aufruf beim Aufruf$0.013

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m2-7", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein1Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.95Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Token in der Antwort. · Reichweite: 1 – 131072
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
toolsAnordnungNein-OpenAI-ähnliche Definitionen von funktionsaufrufenden Werkzeugen. Jeder Eintrag enthält Namen, Beschreibung und Parameter.
tool_choiceStringNein-Auto | Keine | Erforderlich | {Typ:Funktion, Funktion:{Name:”…”}}. Kontrolliert, wann das Modell ein Werkzeug aufrufen muss.
web_search_linkupBooleanNeinfalschOptionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
disable_formattingBooleanNeinfalschWenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Anmerkungen

Unterstützt Interleaved Thinking, Funktionsaufrufe und implizite Prompt-Cache-Reads. Das Denken ist immer aktiv und wird als Ausgabetoken abgerechnet.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/minimax-m2-7.