Qwen3 Max | EmpirioLabs AI Docs

POST /v1/chat/completions

256K-Kontext-Flaggschiff mit bedeutenden Verbesserungen im Schließen, beim Befolgen von Anweisungen und mehrsprachiger Unterstützung sowie mit höherer coding/math Genauigkeit.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`qwen3-max`
Modell-Veröffentlichungsdatum	2025-09-23
Eingabemodalitäten	Text
Ausgabemodalitäten	Text
Kontextfenster	256.000
Gewichtspräzision	-
Maximale Ausgabetoken	65,536
Region	Singapur
Merkmale	Vernunft, code_interpreter, web_search
Native Schlussfolgerung	Nein
Neu	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`
Datum der Einstellung	2026-09-08

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	<=32K $1.08 (war $1.20); 32K-128K $2.16 (war $2.40); 128K-256K $2.70 (war $3.00)
Ausgabe	pro 1 Million generierter Token	<=32K $5.52 (war $6.00); 32K-128K $11.04 (war $12.00); 128K-256K $13.80 (war $15.00)
Websuche	auf Wunsch	$0.015

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-max", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.9`	Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Token in der Antwort. · Reichweite: 1 – 65536
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`tool_web_search`	Boolean	Nein	falsch	Suchen Sie im Internet nach Echtzeitinformationen.
`disable_formatting`	Boolean	Nein	falsch	Überspringe die EmpirioLabs Markdown-Formatierung (Zitation [N] Umschreiben + Referenzblock, wenn Websuche / Tools verwendet wurden). Die rohe Upstream-Antwort mit einfachen [N]-Zitaten wird zurückgegeben.

Anmerkungen

Optionale Websuche fügt beim Aufruf $0.015/call hinzu.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-max.