Qwen3.7 Max | EmpirioLabs AI Docs

POST /v1/chat/completions

Qwen3.7 Max est un modèle textuel phare pour le codage, la productivité, les agents de longue durée, la réflexion approfondie, les outils et le contexte 1M-token.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`qwen3-7-max`
Date de sortie du modèle	2026-05-21
Modalités d’entrée	Texte
Modalités de sortie	Texte
Fenêtre de contexte	1M
Précision du poids	-
Jetons de sortie max	65,536
Région	Singapour
Caractéristiques	raisonnement, web_search, code_interpreter, function_calling, agentic_coding
Inférence autochtone	Non
Nouveau	Oui
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	$2.50
Production	par 1M de jetons générés	$7.50
Recherche web	par appel lors de l’invocation	$0.02
Extracteur de toile	par appel lors de l’invocation	$0.02
Interpréteur de code	par appel lors de l’invocation	$0.02

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. 0 est déterministe et 2 est l’aléatoire maximal. · Plage: 0 – 2
`top_p`	Nombre	non	`0.9`	Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Jetons de sortie maximum. · Répartition: 1 – 65536
`stop`	Corde	non	-	Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
`enable_thinking`	Booléen	non	Vrai	Activez le raisonnement avant de répondre.
`reasoning_effort`	enum	non	`"medium"`	Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. · Autorisé: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Nombre	non	`32768`	Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 64000
`tool_web_search`	Booléen	non	faux	Cherchez sur internet des informations en temps réel. Ajoute $0.02 au coût de la requête pour chaque appel de recherche web invoqué.
`tool_web_extractor`	Booléen	non	faux	Extraire et lire le contenu des URL. Nécessite une recherche et une réflexion sur le Web. Ajoute $0.02 au coût de requête pour chaque appel d’extracteur web invoqué.
`tool_code_interpreter`	Booléen	non	faux	Exécutez du code Python dans un bac à sable. Ça demande de la réflexion. Ajoute $0.02 au coût de requête pour chaque appel d’interpréteur de code invoqué.
`disable_formatting`	Booléen	non	faux	Retournez une sortie brute de type fournisseur sans formatage source EmpirioLabs lorsque cela est supporté.

Notes

Saisie de texte uniquement. La recherche web, l’extracteur web et l’interpréteur de code sont des outils intégrés optionnels exposés à tool_*. Chaque appel d’outil intégré ajoute $0.02 lorsqu’il est invoqué. Les jetons pensants sont présentés comme des jetons de sortie.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils intégrés à une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de tokens. Le nombre d’outils est déjà pris en compte dans cost_usd et est mis en surface pour la transparence.

Variantes

`:variant1`

Terrain	Valeur
Identifiant de modèle	`qwen3-7-max:variant1`
Date de sortie du modèle	2026-05-21
Région	Chine
Fenêtre de contexte	1M
Précision du poids	-
Jetons de sortie max	65,536
Caractéristiques	raisonnement, web_search, code_interpreter, function_calling, agentic_coding
Inférence autochtone	Non
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Prix

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	$1.65 (était $2.50)
Production	par 1M de jetons générés	$4.951 (était $7.50)
Recherche web	par appel lors de l’invocation	$0.01
Extracteur de toile	par appel lors de l’invocation	$0.01
Interpréteur de code	par appel lors de l’invocation	$0.01

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. 0 est déterministe et 2 est l’aléatoire maximal. · Plage: 0 – 2
`top_p`	Nombre	non	`0.9`	Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Jetons de sortie maximum. · Répartition: 1 – 65536
`stop`	Corde	non	-	Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
`enable_thinking`	Booléen	non	Vrai	Activez le raisonnement avant de répondre.
`reasoning_effort`	enum	non	`"medium"`	Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. · Autorisé: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Nombre	non	`32768`	Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 64000
`tool_web_search`	Booléen	non	faux	Cherchez sur internet des informations en temps réel. Ajoute $0.01 au coût de la requête pour chaque appel de recherche web invoqué.
`tool_web_extractor`	Booléen	non	faux	Extraire et lire le contenu des URL. Nécessite une recherche et une réflexion sur le Web. Ajoute $0.01 au coût de requête pour chaque appel d’extracteur web invoqué.
`tool_code_interpreter`	Booléen	non	faux	Exécutez du code Python dans un bac à sable. Ça demande de la réflexion. Ajoute $0.01 au coût de requête pour chaque appel d’interpréteur de code invoqué.
`disable_formatting`	Booléen	non	faux	Retournez une sortie brute de type fournisseur sans formatage source EmpirioLabs lorsque cela est supporté.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-7-max.