Qwen3.5 Omni Flash

POST /v1/chat/completionsKosteneffizientes omnimodales Modell verarbeitet Text, Bild, Audio und Video, mit bis zu 3 Stunden Audio und 1 Stunde Video in 90+ Sprachen.
Auf einen Blick
Preisgestaltung
Beispielanfrage
Parameter
Anmerkungen
Audioabrechnung
- Audio wird mit einem höheren Token-Satz als text/image/Video abgerechnet.
- Wenn Audioausgabe aktiviert ist, wird der Ausgabetext NICHT berechnet – nur Audio-Tokens
Stimme und Sprache
- Verfügbare 55-Stimm-Timbres
- Audioausgabe unterstützt 29 Sprachen und 7 Dialekte.
Pro-Werkzeug-Abrechnung (usage.tool_usage)
Wenn dieses Modell Werkzeuge (Websuche, Code-Interpreter usw.) innerhalb einer einzigen Anfrage aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:
Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-5-omni-flash.
