MiMo V2 Flash

POST /v1/chat/completionsLeichtes, schnelles Denkmodell mit hybrider Aufmerksamkeit und Multi-Token-Vorhersage für kostengünstige Inferenz und starke Benchmark-Werte.
Auf einen Blick
Preisgestaltung
Beispielanfrage
Parameter
Anmerkungen
Leichtgewicht 256K-Kontext-Stufe. Websuche ($0.015/call) wird nur bei Aufforderung belastet. Zwischengespeicherte Eingabetoken werden zu einem starken Rabatt abgerechnet.
Pro-Werkzeug-Abrechnung (usage.tool_usage)
Wenn dieses Modell Werkzeuge (Websuche, Code-Interpreter usw.) innerhalb einer einzigen Anfrage aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:
Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/mimo-v2-flash.
