Qwen3.6 Max Preview | EmpirioLabs AI Docs

POST /v1/chat/completions

Größte Vorschauvariante der 3.6-Serie (nur Text): verbesserte Ausführung von Coding-Agenten, stärkere Frontend-Fähigkeiten und breiteres Long-Tail-Wissen.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`qwen3-6-max-preview`
Modell-Veröffentlichungsdatum	2026-04-20
Eingabemodalitäten	Text
Ausgabemodalitäten	Text
Kontextfenster	256.000
Gewichtspräzision	-
Maximale Ausgabetoken	65,536
Region	Singapur
Merkmale	Vernunft, agentic_coding, web_search
Native Schlussfolgerung	Nein
Neu	Ja
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`
Datum der Einstellung	2026-09-08

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	<=128K $1.31; 128K-256K $1.97\
Ausgabe	pro 1 Million generierter Token	<=128K $7.88; 128K-256K $11.82\
Websuche	pro Aufruf	$0.020

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-6-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Probenahmetemperatur · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`1.0`	Kernprobennahme · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Ausgabetoken · Reichweite: 1 – 65536
`frequency_penalty`	Anzahl	Nein	`0`	Strafe für wiederholte Tokens. >0 reduziert die Wiederholung, <0 fördert sie. · Reichweite: -2 – 2
`presence_penalty`	Anzahl	Nein	`0`	Strafe für neue vs. gesehene Token. >0 fördert neue Themen, <0 ermutigt, beim Thema zu bleiben. · Reichweite: -2 – 2
`reasoning_effort`	ENUM	Nein	`"medium"`	Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: `none`, `low`, `medium`, `high`, `max`
`stop`	String	Nein	-	Komma-separierte Stop-Sequenzen
`enable_thinking`	Boolean	Nein	Stimmt	Begründe step-by-step, bevor du antwortest
`thinking_budget`	Anzahl	Nein	`32768`	Token, die fürs Denken reserviert sind · Reichweite: 1 – 393216
`tool_web_search`	Boolean	Nein	falsch	Suchen Sie im Internet nach Echtzeitinformationen.
`disable_formatting`	Boolean	Nein	falsch	Überspringe die EmpirioLabs Markdown-Formatierung (Zitation [N] Umschreiben + Referenzblock, wenn Websuche / Tools verwendet wurden). Die rohe Upstream-Antwort mit einfachen [N]-Zitaten wird zurückgegeben.

Anmerkungen

Der Preis liegt ~1,5x über 128.000 Token. Klartextfunktionen nur in dieser Vorschau; Multimodal noch nicht aktiviert.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell Werkzeuge (Websuche, Code-Interpreter usw.) innerhalb einer einzigen Anfrage aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-6-max-preview.