Qwen3.7 Plus

Qwen3.7 Plus
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Modèle vision-langage Qwen3.7 économique pour le texte, l’image, la vidéo, le codage, l’utilisation d’outils, la compréhension de l’interface graphique et les flux de travail contextuels 1M.

En un coup d’œil

TerrainValeur
Identifiant de modèleqwen3-7-plus
Date de sortie du modèle2026-06-01
Modalités d’entréeTexte, Image, Vidéo
Modalités de sortieTexte
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max65,536
RégionSingapour
Caractéristiquesraisonnement, vision, vidéo, web_search, code_interpreter, function_calling, structured_output, prefix_continuation, fine_tuning, agentic_coding
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite<=256K $0.40; 256K-1M $1.20
Productionpar 1M de jetons générés<=256K $1.60; 256K-1M $4.80
Recherche Webpar appel$0.03
Recherche d’imagespar appel$0.03

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-7-plus", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 est déterministe et 2 est l’aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie maximum. · Répartition: 1 – 65536
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_thinkingBooléennonVraiActivez le raisonnement avant de répondre.
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. · Autorisé: none, low, medium, high, max
thinking_budgetNombrenon32768Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 256000
response_formatObjetnon-Mode JSON compatible OpenAI ou format de réponse de schéma JSON. Utilisez le mode non-pensant pour les schémas stricts.
vl_high_resolution_imagesBooléennonVraiUtilisez un traitement à haute résolution pour les entrées d’images.
max_pixelsNombrenon2621440Nombre maximal de pixels par image lorsque le traitement haute résolution est désactivé. · Répartition: 4096 – 16777216
video_fpsNombrenon2Images par seconde pour échantillonner depuis les entrées vidéo. · Plage: 0,1 – 10
treat_images_as_videoBooléennonfauxTraitez une séquence d’images comme des images vidéo.
tool_web_searchBooléennonVraiCherchez sur internet des informations en temps réel. Ajoute $0.03 au coût de la requête pour chaque appel invoqué.
tool_web_extractorBooléennonVraiExtraire et lire le contenu des URL. Nécessite une recherche et une réflexion sur le Web.
tool_code_interpreterBooléennonVraiExécutez du code Python dans un bac à sable. Ça demande de la réflexion.
tool_web_search_imageBooléennonVraiCherchez sur le web des images à partir de descriptions textuelles. Ajoute $0.03 au coût de la requête pour chaque appel invoqué.
tool_image_searchBooléennonVraiTrouvez des images similaires à partir d’une image téléchargée. Ajoute $0.03 au coût de la requête pour chaque appel invoqué.
disable_formattingBooléennonfauxRetournez une sortie brute de type fournisseur sans formatage source EmpirioLabs lorsque cela est supporté.

Notes

Le prix est de 3 fois pour input/output au-dessus de 256 000 tokens. La recherche Web, la recherche texte-à-image et la recherche image-à-image ne sont facturées qu’en cas d’invocation.

La recherche texte-to-image et la recherche image-à-image utilisent la ligne tarifaire de la recherche d’image. Les jetons pensants sont présentés comme des jetons de sortie.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils intégrés à une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de tokens. Le nombre d’outils est déjà pris en compte dans cost_usd et est mis en surface pour la transparence.

Variantes

:variant1

TerrainValeur
Identifiant de modèleqwen3-7-plus:variant1
Date de sortie du modèle2026-06-01
RégionChine
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max65,536
Caractéristiquesqwen3.7, raisonnement, vision, vidéo, web_search, code_interpreter, function_calling, structured_output, prefix_continuation, cache, fine_tuning, agentic_coding
Inférence autochtoneNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Prix

ChargeSpecTaux
Entréepar 1M de jetons d’invite<=256K $0.276 (était $0.40); 256K-1M $0.826 (était $1.20)
Productionpar 1M de jetons générés<=256K $1.101 (était $1.60); 256K-1M $3.301 (était $4.80)
Entrée implicite du cachepar 1M de jetons d’invite mis en cache<=256K $0.056 (était $0.08); 256K-1M $0.166 (était $0.24)
Recherche Webpar appel$0.01
Recherche d’imagespar appel$0.01

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 est déterministe et 2 est l’aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie maximum. · Répartition: 1 – 65536
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_thinkingBooléennonVraiActivez le raisonnement avant de répondre.
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. · Autorisé: none, low, medium, high, max
thinking_budgetNombrenon32768Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 256000
response_formatObjetnon-Mode JSON compatible OpenAI ou format de réponse de schéma JSON. Utilisez le mode non-pensant pour les schémas stricts.
vl_high_resolution_imagesBooléennonVraiUtilisez un traitement à haute résolution pour les entrées d’images.
max_pixelsNombrenon2621440Nombre maximal de pixels par image lorsque le traitement haute résolution est désactivé. · Répartition: 4096 – 16777216
video_fpsNombrenon2Images par seconde pour échantillonner depuis les entrées vidéo. · Plage: 0,1 – 10
treat_images_as_videoBooléennonfauxTraitez une séquence d’images comme des images vidéo.
tool_web_searchBooléennonVraiCherchez sur internet des informations en temps réel. Ajoute $0.01 au coût de la requête pour chaque appel invoqué.
tool_web_extractorBooléennonVraiExtraire et lire le contenu des URL. Nécessite une recherche et une réflexion sur le Web.
tool_code_interpreterBooléennonVraiExécutez du code Python dans un bac à sable. Ça demande de la réflexion.
tool_web_search_imageBooléennonVraiCherchez sur le web des images à partir de descriptions textuelles. Ajoute $0.01 au coût de la requête pour chaque appel invoqué.
tool_image_searchBooléennonVraiTrouvez des images similaires à partir d’une image téléchargée. Ajoute $0.01 au coût de la requête pour chaque appel invoqué.
disable_formattingBooléennonfauxRetournez une sortie brute de type fournisseur sans formatage source EmpirioLabs lorsque cela est supporté.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-7-plus.