Qwen3.6 Max Preview

Qwen3.6 Max Preview
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Plus grande variante d’aperçu de la série 3.6 (texte uniquement): meilleure exécution des agents de codage, compétences front-end renforcées et une connaissance plus large des long-tails.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

En un coup d’œil

TerrainValeur
Identifiant de modèleqwen3-6-max-preview
Date de sortie du modèle2026-04-20
Modalités d’entréeTexte
Modalités de sortieTexte
Fenêtre de contexte256K
Précision du poids-
Jetons de sortie max65,536
RégionSingapour
Caractéristiquesraisonnement, agentic_coding, web_search
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages
Date de dépréciation2026-09-08

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite<=128K $1.31; 128K-256K $1.97
Productionpar 1M de jetons générés<=128K $7.88; 128K-256K $11.82
Recherche Webpar appel$0.020

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage · Plage: 0 – 2
top_pNombrenon1.0Échantillonnage du noyau · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie max · Répartition: 1 – 65536
frequency_penaltyNombrenon0Pénalité pour jetons répétés. >0 réduit la répétition, <0 l’encourage. · Portée: -2 – 2
presence_penaltyNombrenon0Pénalité pour les jetons nouveaux vs. vus. >0 encourage de nouveaux sujets, <0 encourage à rester dans le sujet. · Portée: -2 – 2
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max
stopCordenon-Séquences d’arrêts séparées par virgules
enable_thinkingBooléennonVraiRaison step-by-step avant de répondre
thinking_budgetNombrenon32768Jetons réservés à la pensée · Répartition: 1 – 393216
tool_web_searchBooléennonfauxCherchez sur internet des informations en temps réel.
disable_formattingBooléennonfauxIgnorez la mise en forme EmpirioLabs Markdown (citation [N] réécriture + bloc Références lorsque la recherche web / outils ont été utilisés). La réponse brute en amont avec des citations simples [N] est retournée.

Notes

Le prix est ~1,5 fois supérieur aux 128 000 tokens. Capacités de texte clair uniquement dans cette prévisualisation; Le multimodal n’est pas encore activé.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils (recherche web, interpréteur de code, etc.) dans une seule requête, la réponse porte une carte de usage.tool_usage normalisée à côté des comptes de tokens. L’exemple ci-dessous montre la forme - les noms exacts des champs, les unités et les outils qui apparaissent peuvent varier légèrement selon le fournisseur:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

Le nombre d’outils est déjà pris en compte dans cost_usd - ils sont présentés pour la transparence afin que vous puissiez auditer la facturation par outil. Le champ est omis lorsqu’aucun outil n’a été invoqué.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-6-max-preview.