Qwen3.6 Max Preview

Qwen3.6 Max Preview
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Größte Vorschauvariante der 3.6-Serie (nur Text): verbesserte Ausführung von Coding-Agenten, stärkere Frontend-Fähigkeiten und breiteres Long-Tail-Wissen.

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

Auf einen Blick

SpielfeldWert
Modell-IDqwen3-6-max-preview
Modell-Veröffentlichungsdatum2026-04-20
EingabemodalitätenText
AusgabemodalitätenText
Kontextfenster256.000
Gewichtspräzision-
Maximale Ausgabetoken65,536
RegionSingapur
MerkmaleVernunft, agentic_coding, web_search
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages
Datum der Einstellung2026-09-08

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token<=128K $1.31; 128K-256K $1.97\
Ausgabepro 1 Million generierter Token<=128K $7.88; 128K-256K $11.82\
Websuchepro Aufruf$0.020

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Probenahmetemperatur · Reichweite: 0 – 2
top_pAnzahlNein1.0Kernprobennahme · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabetoken · Reichweite: 1 – 65536
frequency_penaltyAnzahlNein0Strafe für wiederholte Tokens. >0 reduziert die Wiederholung, <0 fördert sie. · Reichweite: -2 – 2
presence_penaltyAnzahlNein0Strafe für neue vs. gesehene Token. >0 fördert neue Themen, <0 ermutigt, beim Thema zu bleiben. · Reichweite: -2 – 2
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max
stopStringNein-Komma-separierte Stop-Sequenzen
enable_thinkingBooleanNeinStimmtBegründe step-by-step, bevor du antwortest
thinking_budgetAnzahlNein32768Token, die fürs Denken reserviert sind · Reichweite: 1 – 393216
tool_web_searchBooleanNeinfalschSuchen Sie im Internet nach Echtzeitinformationen.
disable_formattingBooleanNeinfalschÜberspringe die EmpirioLabs Markdown-Formatierung (Zitation [N] Umschreiben + Referenzblock, wenn Websuche / Tools verwendet wurden). Die rohe Upstream-Antwort mit einfachen [N]-Zitaten wird zurückgegeben.

Anmerkungen

Der Preis liegt ~1,5x über 128.000 Token. Klartextfunktionen nur in dieser Vorschau; Multimodal noch nicht aktiviert.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell Werkzeuge (Websuche, Code-Interpreter usw.) innerhalb einer einzigen Anfrage aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-6-max-preview.