Qwen3.7 Plus | EmpirioLabs AI Docs

POST /v1/chat/completions

Modèle vision-langage Qwen3.7 économique pour le texte, l’image, la vidéo, le codage, l’utilisation d’outils, la compréhension de l’interface graphique et les flux de travail contextuels 1M.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`qwen3-7-plus`
Date de sortie du modèle	2026-06-01
Modalités d’entrée	Texte, Image, Vidéo
Modalités de sortie	Texte
Fenêtre de contexte	1M
Précision du poids	-
Jetons de sortie max	65,536
Région	Singapour
Caractéristiques	raisonnement, vision, vidéo, web_search, code_interpreter, function_calling, structured_output, prefix_continuation, fine_tuning, agentic_coding
Inférence autochtone	Non
Nouveau	Oui
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	<=256K $0.40; 256K-1M $1.20
Production	par 1M de jetons générés	<=256K $1.60; 256K-1M $4.80
Recherche Web	par appel	$0.03
Recherche d’images	par appel	$0.03

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-7-plus", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. 0 est déterministe et 2 est l’aléatoire maximal. · Plage: 0 – 2
`top_p`	Nombre	non	`0.9`	Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Jetons de sortie maximum. · Répartition: 1 – 65536
`stop`	Corde	non	-	Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
`enable_thinking`	Booléen	non	Vrai	Activez le raisonnement avant de répondre.
`reasoning_effort`	enum	non	`"medium"`	Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. · Autorisé: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Nombre	non	`32768`	Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 256000
`response_format`	Objet	non	-	Mode JSON compatible OpenAI ou format de réponse de schéma JSON. Utilisez le mode non-pensant pour les schémas stricts.
`vl_high_resolution_images`	Booléen	non	Vrai	Utilisez un traitement à haute résolution pour les entrées d’images.
`max_pixels`	Nombre	non	`2621440`	Nombre maximal de pixels par image lorsque le traitement haute résolution est désactivé. · Répartition: 4096 – 16777216
`video_fps`	Nombre	non	`2`	Images par seconde pour échantillonner depuis les entrées vidéo. · Plage: 0,1 – 10
`treat_images_as_video`	Booléen	non	faux	Traitez une séquence d’images comme des images vidéo.
`tool_web_search`	Booléen	non	Vrai	Cherchez sur internet des informations en temps réel. Ajoute $0.03 au coût de la requête pour chaque appel invoqué.
`tool_web_extractor`	Booléen	non	Vrai	Extraire et lire le contenu des URL. Nécessite une recherche et une réflexion sur le Web.
`tool_code_interpreter`	Booléen	non	Vrai	Exécutez du code Python dans un bac à sable. Ça demande de la réflexion.
`tool_web_search_image`	Booléen	non	Vrai	Cherchez sur le web des images à partir de descriptions textuelles. Ajoute $0.03 au coût de la requête pour chaque appel invoqué.
`tool_image_search`	Booléen	non	Vrai	Trouvez des images similaires à partir d’une image téléchargée. Ajoute $0.03 au coût de la requête pour chaque appel invoqué.
`disable_formatting`	Booléen	non	faux	Retournez une sortie brute de type fournisseur sans formatage source EmpirioLabs lorsque cela est supporté.

Notes

Le prix est de 3 fois pour input/output au-dessus de 256 000 tokens. La recherche Web, la recherche texte-à-image et la recherche image-à-image ne sont facturées qu’en cas d’invocation.

La recherche texte-to-image et la recherche image-à-image utilisent la ligne tarifaire de la recherche d’image. Les jetons pensants sont présentés comme des jetons de sortie.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils intégrés à une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de tokens. Le nombre d’outils est déjà pris en compte dans cost_usd et est mis en surface pour la transparence.

Variantes

`:variant1`

Terrain	Valeur
Identifiant de modèle	`qwen3-7-plus:variant1`
Date de sortie du modèle	2026-06-01
Région	Chine
Fenêtre de contexte	1M
Précision du poids	-
Jetons de sortie max	65,536
Caractéristiques	qwen3.7, raisonnement, vision, vidéo, web_search, code_interpreter, function_calling, structured_output, prefix_continuation, cache, fine_tuning, agentic_coding
Inférence autochtone	Non
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Prix

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	<=256K $0.276 (était $0.40); 256K-1M $0.826 (était $1.20)
Production	par 1M de jetons générés	<=256K $1.101 (était $1.60); 256K-1M $3.301 (était $4.80)
Entrée implicite du cache	par 1M de jetons d’invite mis en cache	<=256K $0.056 (était $0.08); 256K-1M $0.166 (était $0.24)
Recherche Web	par appel	$0.01
Recherche d’images	par appel	$0.01

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. 0 est déterministe et 2 est l’aléatoire maximal. · Plage: 0 – 2
`top_p`	Nombre	non	`0.9`	Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Jetons de sortie maximum. · Répartition: 1 – 65536
`stop`	Corde	non	-	Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
`enable_thinking`	Booléen	non	Vrai	Activez le raisonnement avant de répondre.
`reasoning_effort`	enum	non	`"medium"`	Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. · Autorisé: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Nombre	non	`32768`	Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 256000
`response_format`	Objet	non	-	Mode JSON compatible OpenAI ou format de réponse de schéma JSON. Utilisez le mode non-pensant pour les schémas stricts.
`vl_high_resolution_images`	Booléen	non	Vrai	Utilisez un traitement à haute résolution pour les entrées d’images.
`max_pixels`	Nombre	non	`2621440`	Nombre maximal de pixels par image lorsque le traitement haute résolution est désactivé. · Répartition: 4096 – 16777216
`video_fps`	Nombre	non	`2`	Images par seconde pour échantillonner depuis les entrées vidéo. · Plage: 0,1 – 10
`treat_images_as_video`	Booléen	non	faux	Traitez une séquence d’images comme des images vidéo.
`tool_web_search`	Booléen	non	Vrai	Cherchez sur internet des informations en temps réel. Ajoute $0.01 au coût de la requête pour chaque appel invoqué.
`tool_web_extractor`	Booléen	non	Vrai	Extraire et lire le contenu des URL. Nécessite une recherche et une réflexion sur le Web.
`tool_code_interpreter`	Booléen	non	Vrai	Exécutez du code Python dans un bac à sable. Ça demande de la réflexion.
`tool_web_search_image`	Booléen	non	Vrai	Cherchez sur le web des images à partir de descriptions textuelles. Ajoute $0.01 au coût de la requête pour chaque appel invoqué.
`tool_image_search`	Booléen	non	Vrai	Trouvez des images similaires à partir d’une image téléchargée. Ajoute $0.01 au coût de la requête pour chaque appel invoqué.
`disable_formatting`	Booléen	non	faux	Retournez une sortie brute de type fournisseur sans formatage source EmpirioLabs lorsque cela est supporté.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-7-plus.