Mistral Small 4

Mistral AI · Text Generation

POST /v1/chat/completions

Hybridmodell, das die Familien Instructing, Reasoning (Magistral) und Devstral vereint: 40 % kürzere Abschlusszeit und 3-facher Durchsatz im Vergleich zu Small 3.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`mistral-small-4`
Modell-Veröffentlichungsdatum	2026-03-16
Eingabemodalitäten	Text, Bild
Ausgabemodalitäten	Text
Kontextfenster	256.000
Gewichtspräzision	-
Maximale Ausgabetoken	65,536
Merkmale	Vision
Native Schlussfolgerung	Nein
Neu	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$0.15
Ausgabe	pro 1 Million generierter Token	$0.60
Standard-Websuche	pro Aufruf	$0.084
Premium-Websuche	pro Aufruf	$0.140
Code-Interpreter	pro Aufruf	$0.084
Bilderzeugung	pro Bild	$0.280

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "mistral-small-4", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`reasoning_enabled`	Boolean	Nein	Stimmt	Erweitertes Schließen aktivieren (maps to reasoning: high\|keine)
`tool_web_search`	Boolean	Nein	Stimmt	Aktivieren Sie web_search Tool
`web_search_tier`	ENUM	Nein	`"standard"`	Standard- oder Premium-Websuchtier. Premium verwendet hochwertigere Quellen. · Erlaubt: `standard`, `premium`
`tool_code_interpreter`	Boolean	Nein	Stimmt	Erlaube dem Modell, Python-Code in einer Sandbox auszuführen, um Daten zu berechnen und zu analysieren.
`tool_image_generation`	Boolean	Nein	Stimmt	Erlauben Sie dem Modell, Bilder inline über das Platform Image-Gen-Tool zu generieren.
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 1,5
`max_tokens`	Anzahl	Nein	`4096`	Maximale Token in der Antwort. · Reichweite: 1 – 32768
`disable_formatting`	Boolean	Nein	falsch	Überspringen Sie das EmpirioLabs Markdown-Format (Zitation [N], Umschreibung + Referenzblock, wenn das web_search-Tool verwendet wurde). Die rohe Upstream-Antwort mit einfachen [N]-Zitaten wird zurückgegeben.

Anmerkungen

Werkzeuge (Websuche, Code-Interpreter, Bildgenerierung) werden nur abgerechnet, wenn sie tatsächlich aufgerufen werden.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell in einer einzigen Anfrage eingebaute Werkzeuge (Websuche, Code-Interpreter usw.) aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map zusammen mit den Token-Zählen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/mistral-small-4.