Qwen3.5 Plus

Qwen3.5 Plus
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Modèle multimodal avec architecture hybride pour une réflexion profonde efficace et une compréhension visuelle à travers le texte, l’image et la vidéo dans un contexte 1M.

En un coup d’œil

TerrainValeur
Identifiant de modèleqwen3-5-plus
Date de sortie du modèle2026-02-16
Modalités d’entréeTexte, Image, Vidéo
Modalités de sortieTexte
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max65,536
RégionSingapour
Caractéristiquesvision, web_search, code_interpreter, function_calling, raisonnement
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite<=256K $0.36 (était $0.40); 256K-1M $1.08 (était $1.20)
Productionpar 1M de jetons générés<=256K $2.21 (était $2.40); 256K-1M $6.62 (était $7.20)
Recherche Webpar appel$0.015
Recherche d’imagespar appel$0.012

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-5-plus", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Maximum de jetons dans la réponse. · Répartition: 1 – 65536
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
vl_high_resolution_imagesBooléennonVraiUtilisez une résolution plus élevée pour les images d’entrée. Un meilleur détail à un coût plus élevé.
enable_thinkingBooléennonVraiActivez le mode pensée étendue. Plus lent, mais améliore les tâches qui demandent beaucoup de raisonnement.
max_pixelsNombrenon2621440Nombre maximal de pixels par image d’entrée. Plus grand = plus de détails mais plus lent / plus de jetons. · Répartition: 1 – 99999999
tool_web_searchBooléennonfauxCherchez sur internet des informations en temps réel.
tool_web_extractorBooléennonVraiExtraire et lire le contenu des URL. Nécessite une recherche et une réflexion sur le Web.
tool_code_interpreterBooléennonVraiExécutez du code Python dans un bac à sable. Ça demande de la réflexion.
tool_web_search_imageBooléennonVraiCherchez sur le web des images à partir de descriptions textuelles.
tool_image_searchBooléennonVraiTrouvez des images similaires à partir d’une image téléchargée.
video_fpsNombrenon2Images par seconde échantillonnées à partir de la vidéo d’entrée pour analyse. · Plage: 0,1 – 10
treat_images_as_videoBooléennonfauxConsidérez une séquence d’images d’entrée comme une vidéo pour le raisonnement temporel.
disable_formattingBooléennonfauxIgnorez la mise en forme EmpirioLabs Markdown (citation [N] réécriture + bloc Références lorsque la recherche web / outils ont été utilisés). La réponse brute en amont avec des citations simples [N] est retournée.

Notes

Le prix est de 3 fois pour input/output au-dessus de 256 000 tokens. Les outils intégrés (recherche web, extracteur web, interpréteur de code, recherche d’images) ne sont facturés qu’en cas d’invocation.

La recherche texte-to-image et la recherche image-à-image utilisent la ligne tarifaire de la recherche d’image. Chaque recherche d’image invoquée est facturée au tarif indiqué par appel.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils (recherche web, interpréteur de code, etc.) dans une seule requête, la réponse porte une carte de usage.tool_usage normalisée à côté des comptes de tokens. L’exemple ci-dessous montre la forme - les noms exacts des champs, les unités et les outils qui apparaissent peuvent varier légèrement selon le fournisseur:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

Le nombre d’outils est déjà pris en compte dans cost_usd - ils sont présentés pour la transparence afin que vous puissiez auditer la facturation par outil. Le champ est omis lorsqu’aucun outil n’a été invoqué.

Variantes

:variant1

TerrainValeur
Identifiant de modèleqwen3-5-plus:variant1
Date de sortie du modèle2026-02-16
RégionChine
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max65,536
Caractéristiquesraisonnement, vision, vidéo, web_search, function_calling, structured_output, agentic_coding
Inférence autochtoneNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Prix

ChargeSpecTaux
Entréepar 1M de jetons d’invite<=128K $0.115 (était $0.36); 128K-256K $0.287 (était $0.36); 256K-1M $0.573 (était $1.08)
Productionpar 1M de jetons générés<=128K $0.688 (était $2.21); 128K-256K $1.72 (était $2.21); 256K-1M $3.44 (était $6.62)
Recherche webpar requête lorsqu’activée$0.01

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 est déterministe et 2 est l’aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie maximum. · Répartition: 1 – 65536
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_thinkingBooléennonVraiActivez le raisonnement avant de répondre.
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max
thinking_budgetNombrenon32768Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Portée: 1 – 80 000
response_formatObjetnon-Mode JSON compatible OpenAI ou format de réponse de schéma JSON. Utilisez le mode non-pensant pour les schémas stricts.
vl_high_resolution_imagesBooléennonVraiUtilisez un traitement à haute résolution pour les entrées d’images.
max_pixelsNombrenon2621440Nombre maximal de pixels par image lorsque le traitement haute résolution est désactivé. · Répartition: 4096 – 16777216
video_fpsNombrenon2Images par seconde pour échantillonner depuis les entrées vidéo. · Plage: 0,1 – 10
tool_web_searchBooléennonfauxCherchez sur internet des informations en temps réel. Ajoute $0.01 au coût de la requête lorsqu’il est activé.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-5-plus.