Qwen3.6 Flash

Qwen3.6 Flash
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Schnelles Qwen3.6-Vision-Sprachmodell für agentisches Codieren, mathematisches Denken, räumliches Verstehen, OCR sowie Text-, Bild- und Videoeingaben.

Auf einen Blick

SpielfeldWert
Modell-IDqwen3-6-flash
Modell-Veröffentlichungsdatum2026-04-16
EingabemodalitätenText, Bild, Video
AusgabemodalitätenText
Kontextfenster1M
Gewichtspräzision-
Maximale Ausgabetoken65,536
RegionSingapur
MerkmaleVernunft, Vision, Video, web_search, function_calling, structured_output, agentic_coding
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token<=256K $0.25; 256K-1M $1.00
Ausgabepro 1 Million generierter Token<=256K $1.50; 256K-1M $4.00
Websuchepro Abfrage, wenn aktiviert$0.02

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 65536
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
enable_thinkingBooleanNeinStimmtAktiviere das Schließen, bevor du antwortest.
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max
thinking_budgetAnzahlNein32768Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 64.000
response_formatGegenstandNein-OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat. Nutze den nicht-denkenden Modus für strenge Schemata.
vl_high_resolution_imagesBooleanNeinStimmtVerwenden Sie eine höher aufgelöste Verarbeitung für Bildeingaben.
max_pixelsAnzahlNein2621440Maximale Pixelanzahl pro Bild, wenn hochauflösende Verarbeitung deaktiviert ist. · Reichweite: 4096 – 16777216
video_fpsAnzahlNein2Bilder pro Sekunde, um von Videoeingängen abzutasten. · Reichweite: 0,1 – 10
tool_web_searchBooleanNeinfalschSuchen Sie im Internet nach Echtzeitinformationen. Das erhöht $0.02 auf die Anforderungskosten, wenn es aktiviert ist.

Anmerkungen

Unterstützt Text-, Bild- und Videoeingaben. Die Websuche ist über tool_web_search verfügbar und fügt $0.02 pro Abfrage hinzu, wenn sie aktiviert ist. Thinking Tokens werden als Output Tokens beworben. Explizite Cache-Kontrollen werden nicht unterstützt.

Varianten

:variant1

SpielfeldWert
Modell-IDqwen3-6-flash:variant1
Modell-Veröffentlichungsdatum2026-04-16
RegionChina
Kontextfenster1M
Gewichtspräzision-
Maximale Ausgabetoken65,536
MerkmaleVernunft, Vision, Video, web_search, function_calling, structured_output, agentic_coding
Native SchlussfolgerungNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token<=256K $0.165 (war $0.25); 256K-1M $0.66 (war $1.00)
Ausgabepro 1 Million generierter Token<=256K $0.99 (war $1.50); 256K-1M $3.961 (war $4.00)
Websuchepro Abfrage, wenn aktiviert$0.01

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 65536
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
enable_thinkingBooleanNeinStimmtAktiviere das Schließen, bevor du antwortest.
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max
thinking_budgetAnzahlNein32768Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 128.000
response_formatGegenstandNein-OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat. Nutze den nicht-denkenden Modus für strenge Schemata.
vl_high_resolution_imagesBooleanNeinStimmtVerwenden Sie eine höher aufgelöste Verarbeitung für Bildeingaben.
max_pixelsAnzahlNein2621440Maximale Pixelanzahl pro Bild, wenn hochauflösende Verarbeitung deaktiviert ist. · Reichweite: 4096 – 16777216
video_fpsAnzahlNein2Bilder pro Sekunde, um von Videoeingängen abzutasten. · Reichweite: 0,1 – 10
tool_web_searchBooleanNeinfalschSuchen Sie im Internet nach Echtzeitinformationen. Das erhöht $0.01 auf die Anforderungskosten, wenn es aktiviert ist.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash.