Qwen3 Max

Qwen3 Max
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Contexte phare 256K avec des améliorations majeures du raisonnement, du suivi des instructions et du support multilingue, ainsi qu’une meilleure précision coding/math.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

En un coup d’œil

TerrainValeur
Identifiant de modèleqwen3-max
Date de sortie du modèle2025-09-23
Modalités d’entréeTexte
Modalités de sortieTexte
Fenêtre de contexte256K
Précision du poids-
Jetons de sortie max65,536
RégionSingapour
Caractéristiquesraisonnement, code_interpreter, web_search
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages
Date de dépréciation2026-09-08

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite<=32K $1.08 (était $1.20); 32K-128K $2.16 (était $2.40); 128K-256K $2.70 (était $3.00)
Productionpar 1M de jetons générés<=32K $5.52 (était $6.00); 32K-128K $11.04 (était $12.00); 128K-256K $13.80 (était $15.00)
Recherche Webà la demande$0.015

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-max", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Maximum de jetons dans la réponse. · Répartition: 1 – 65536
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
tool_web_searchBooléennonfauxCherchez sur internet des informations en temps réel.
disable_formattingBooléennonfauxIgnorez la mise en forme EmpirioLabs Markdown (citation [N] réécriture + bloc Références lorsque la recherche web / outils ont été utilisés). La réponse brute en amont avec des citations simples [N] est retournée.

Notes

La recherche web optionnelle ajoute $0.015/call lorsqu’elle est invoquée.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-max.