Qwen3 Max Preview

Qwen3 Max Preview
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Vorschau-Veröffentlichung mit erheblichen Fortschritten gegenüber der 2.5-Serie in Bezug auf Chinesisch-Englisch-Verständnis, komplexe Anleitungen, mehrsprachige Fähigkeiten und Werkzeugnutzung.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

Auf einen Blick

SpielfeldWert
Modell-IDqwen3-max-preview
Modell-Veröffentlichungsdatum2025-09-05
EingabemodalitätenText
AusgabemodalitätenText
Kontextfenster256.000
Gewichtspräzision-
Maximale Ausgabetoken65,536
RegionSingapur
MerkmaleVernunft, code_interpreter, web_search
Native SchlussfolgerungNein
NeuNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages
Datum der Einstellung2026-09-08

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token<=32K $1.08 (war $1.20); 32K-128K $2.16 (war $2.40); 128K-256K $2.70 (war $3.00)
Ausgabepro 1 Million generierter Token<=32K $4.80 (war $6.00); 32K-128K $9.60 (war $12.00); 128K-256K $12.00 (war $15.00)

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Probenahmetemperatur · Reichweite: 0 – 2
top_pAnzahlNein1.0Kernprobennahme · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabetoken · Reichweite: 1 – 65536
frequency_penaltyAnzahlNein0Strafe für wiederholte Tokens. >0 reduziert die Wiederholung, <0 fördert sie. · Reichweite: -2 – 2
presence_penaltyAnzahlNein0Strafe für neue vs. gesehene Token. >0 fördert neue Themen, <0 ermutigt, beim Thema zu bleiben. · Reichweite: -2 – 2
stopStringNein-Komma-separierte Stop-Sequenzen
enable_thinkingBooleanNeinStimmtModel denkt step-by-step nach, bevor es antwortet.
tool_code_interpreterBooleanNeinfalschErlaube dem Modell, Python-Code zu schreiben und auszuführen.
disable_formattingBooleanNeinfalschÜberspringe die EmpirioLabs Markdown-Formatierung (Zitation [N] Umschreiben + Referenzblock, wenn Websuche / Tools verwendet wurden). Die rohe Upstream-Antwort mit einfachen [N]-Zitaten wird zurückgegeben.

Anmerkungen

Deep Thinking + Code-Interpreter sind beide als Opt-in-Schalter verfügbar.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-max-preview.