Mistral Small 4

Mistral Small 4
Mistral AI · Text Generation
POST /v1/chat/completions

Hybridmodell, das die Familien Instructing, Reasoning (Magistral) und Devstral vereint: 40 % kürzere Abschlusszeit und 3-facher Durchsatz im Vergleich zu Small 3.

Auf einen Blick

SpielfeldWert
Modell-IDmistral-small-4
Modell-Veröffentlichungsdatum2026-03-16
EingabemodalitätenText, Bild
AusgabemodalitätenText
Kontextfenster256.000
Gewichtspräzision-
Maximale Ausgabetoken65,536
MerkmaleVision
Native SchlussfolgerungNein
NeuNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$0.15
Ausgabepro 1 Million generierter Token$0.60
Standard-Websuchepro Aufruf$0.084
Premium-Websuchepro Aufruf$0.140
Code-Interpreterpro Aufruf$0.084
Bilderzeugungpro Bild$0.280

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "mistral-small-4", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
reasoning_enabledBooleanNeinStimmtErweitertes Schließen aktivieren (maps to reasoning: high|keine)
tool_web_searchBooleanNeinStimmtAktivieren Sie web_search Tool
web_search_tierENUMNein"standard"Standard- oder Premium-Websuchtier. Premium verwendet hochwertigere Quellen. · Erlaubt: standard, premium
tool_code_interpreterBooleanNeinStimmtErlaube dem Modell, Python-Code in einer Sandbox auszuführen, um Daten zu berechnen und zu analysieren.
tool_image_generationBooleanNeinStimmtErlauben Sie dem Modell, Bilder inline über das Platform Image-Gen-Tool zu generieren.
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 1,5
max_tokensAnzahlNein4096Maximale Token in der Antwort. · Reichweite: 1 – 32768
disable_formattingBooleanNeinfalschÜberspringen Sie das EmpirioLabs Markdown-Format (Zitation [N], Umschreibung + Referenzblock, wenn das web_search-Tool verwendet wurde). Die rohe Upstream-Antwort mit einfachen [N]-Zitaten wird zurückgegeben.

Anmerkungen

Werkzeuge (Websuche, Code-Interpreter, Bildgenerierung) werden nur abgerechnet, wenn sie tatsächlich aufgerufen werden.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell in einer einzigen Anfrage eingebaute Werkzeuge (Websuche, Code-Interpreter usw.) aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map zusammen mit den Token-Zählen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/mistral-small-4.