Qwen3.5 Flash

POST /v1/chat/completionsModèle vision-langage avec une attention linéaire hybride plus un MoE clairsemé, un contexte 1M, et une inférence rapide multimodale text/image/vidéo.
En un coup d’œil
Tarification
Exemple de demande
Paramètres
Notes
Outils intégrés (facturés uniquement lorsqu’ils sont invoqués)
- Recherche web: $0.015/call
- Extracteur de toile: gratuit
- Interprète de code: libre
- Recherche texte-image: $0.012/call
- Recherche image à image: $0.012/call
Autres
- Les jetons pensants sont présentés comme des jetons de sortie
La recherche texte-to-image et la recherche image-à-image utilisent la ligne tarifaire de la recherche d’image. Chaque recherche d’image invoquée est facturée au tarif indiqué par appel.
Facturation par outil (usage.tool_usage)
Lorsque ce modèle invoque des outils (recherche web, interpréteur de code, etc.) dans une seule requête, la réponse porte une carte de usage.tool_usage normalisée à côté des comptes de tokens. L’exemple ci-dessous montre la forme - les noms exacts des champs, les unités et les outils qui apparaissent peuvent varier légèrement selon le fournisseur:
Le nombre d’outils est déjà pris en compte dans cost_usd - ils sont présentés pour la transparence afin que vous puissiez auditer la facturation par outil. Le champ est omis lorsqu’aucun outil n’a été invoqué.
Variantes
:variant1
Prix
Paramètres
_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-5-flash.
