Qwen3 Max Preview | EmpirioLabs AI Docs

POST /v1/chat/completions

Version preview avec des avancées majeures par rapport à la série 2.5 en matière de compréhension chinois-anglais, d’instructions complexes, de capacité multilingue et d’utilisation des outils.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`qwen3-max-preview`
Date de sortie du modèle	2025-09-05
Modalités d’entrée	Texte
Modalités de sortie	Texte
Fenêtre de contexte	256K
Précision du poids	-
Jetons de sortie max	65,536
Région	Singapour
Caractéristiques	raisonnement, code_interpreter, web_search
Inférence autochtone	Non
Nouveau	Non
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`
Date de dépréciation	2026-09-08

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	<=32K $1.08 (était $1.20); 32K-128K $2.16 (était $2.40); 128K-256K $2.70 (était $3.00)
Production	par 1M de jetons générés	<=32K $4.80 (était $6.00); 32K-128K $9.60 (était $12.00); 128K-256K $12.00 (était $15.00)

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage · Plage: 0 – 2
`top_p`	Nombre	non	`1.0`	Échantillonnage du noyau · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Jetons de sortie max · Répartition: 1 – 65536
`frequency_penalty`	Nombre	non	`0`	Pénalité pour jetons répétés. >0 réduit la répétition, <0 l’encourage. · Portée: -2 – 2
`presence_penalty`	Nombre	non	`0`	Pénalité pour les jetons nouveaux vs. vus. >0 encourage de nouveaux sujets, <0 encourage à rester dans le sujet. · Portée: -2 – 2
`stop`	Corde	non	-	Séquences d’arrêts séparées par virgules
`enable_thinking`	Booléen	non	Vrai	Model réfléchit step-by-step avant de répondre.
`tool_code_interpreter`	Booléen	non	faux	Permettre au modèle d’écrire et d’exécuter du code Python.
`disable_formatting`	Booléen	non	faux	Ignorez la mise en forme EmpirioLabs Markdown (citation [N] réécriture + bloc Références lorsque la recherche web / outils ont été utilisés). La réponse brute en amont avec des citations simples [N] est retournée.

Notes

Deep Thinking + interpréteur de code, tous deux disponibles en option optionnelle.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-max-preview.