Qwen3.5 Flash

POST /v1/chat/completionsVision-Sprachmodell mit hybrider linearer Aufmerksamkeit plus spärlicher MoE, 1M-Kontext und schneller multimodaler text/image-/Videoinferenz.
Auf einen Blick
Preisgestaltung
Beispielanfrage
Parameter
Anmerkungen
Eingebaute Werkzeuge (nur beim Aufruf abgerechnet)
- Websuche: $0.015/call
- Netzextraktor: kostenlos
- Code-Interpreter: kostenlos
- Text-zu-Bild-Suche: $0.012/call
- Bild-zu-Bild-Suche: $0.012/call
Sonstiges
- Denkende Tokens werden als Ausgabe-Tokens bezeichnet
Text-zu-Bild-Suche und Bild-zu-Bild-Suche verwenden die Preiszeile für Bildersuche. Jede ausgerufene Bildsuche wird zu dem angegebenen Preis pro Anruf berechnet.
Pro-Werkzeug-Abrechnung (usage.tool_usage)
Wenn dieses Modell Werkzeuge (Websuche, Code-Interpreter usw.) innerhalb einer einzigen Anfrage aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:
Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.
Varianten
:variant1
Preisgestaltung
Parameter
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-5-flash.
