Qwen3.6 Flash

Alibaba Cloud · Text Generation
POST /v1/chat/completionsSchnelles Qwen3.6-Vision-Sprachmodell für agentisches Codieren, mathematisches Denken, räumliches Verstehen, OCR sowie Text-, Bild- und Videoeingaben.
Auf einen Blick
| Spielfeld | Wert |
|---|---|
| Modell-ID | qwen3-6-flash |
| Modell-Veröffentlichungsdatum | 2026-04-16 |
| Eingabemodalitäten | Text, Bild, Video |
| Ausgabemodalitäten | Text |
| Kontextfenster | 1M |
| Gewichtspräzision | - |
| Maximale Ausgabetoken | 65,536 |
| Region | Singapur |
| Merkmale | Vernunft, Vision, Video, web_search, function_calling, structured_output, agentic_coding |
| Native Schlussfolgerung | Nein |
| Neu | Ja |
| Unterstützte Endpunkte | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Preisgestaltung
| Berechnen | Spezifikation | Zinssatz |
|---|---|---|
| Eingabe | pro 1M Prompt-Token | <=256K $0.25; 256K-1M $1.00 |
| Ausgabe | pro 1 Million generierter Token | <=256K $1.50; 256K-1M $4.00 |
| Websuche | pro Abfrage, wenn aktiviert | $0.02 |
Beispielanfrage
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'
Parameter
| Parameter | Typ | Erforderlich | Default | Beschreibung |
|---|---|---|---|---|
temperature | Anzahl | Nein | 0.7 | Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2 |
top_p | Anzahl | Nein | 0.9 | Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1 |
max_tokens | Anzahl | Nein | 4096 | Maximale Ausgabe-Token. · Reichweite: 1 – 65536 |
stop | String | Nein | - | Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren. |
enable_thinking | Boolean | Nein | Stimmt | Aktiviere das Schließen, bevor du antwortest. |
reasoning_effort | ENUM | Nein | "medium" | Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max |
thinking_budget | Anzahl | Nein | 32768 | Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 64.000 |
response_format | Gegenstand | Nein | - | OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat. Nutze den nicht-denkenden Modus für strenge Schemata. |
vl_high_resolution_images | Boolean | Nein | Stimmt | Verwenden Sie eine höher aufgelöste Verarbeitung für Bildeingaben. |
max_pixels | Anzahl | Nein | 2621440 | Maximale Pixelanzahl pro Bild, wenn hochauflösende Verarbeitung deaktiviert ist. · Reichweite: 4096 – 16777216 |
video_fps | Anzahl | Nein | 2 | Bilder pro Sekunde, um von Videoeingängen abzutasten. · Reichweite: 0,1 – 10 |
tool_web_search | Boolean | Nein | falsch | Suchen Sie im Internet nach Echtzeitinformationen. Das erhöht $0.02 auf die Anforderungskosten, wenn es aktiviert ist. |
Anmerkungen
Unterstützt Text-, Bild- und Videoeingaben. Die Websuche ist über tool_web_search verfügbar und fügt $0.02 pro Abfrage hinzu, wenn sie aktiviert ist. Thinking Tokens werden als Output Tokens beworben. Explizite Cache-Kontrollen werden nicht unterstützt.
Varianten
:variant1
| Spielfeld | Wert |
|---|---|
| Modell-ID | qwen3-6-flash:variant1 |
| Modell-Veröffentlichungsdatum | 2026-04-16 |
| Region | China |
| Kontextfenster | 1M |
| Gewichtspräzision | - |
| Maximale Ausgabetoken | 65,536 |
| Merkmale | Vernunft, Vision, Video, web_search, function_calling, structured_output, agentic_coding |
| Native Schlussfolgerung | Nein |
| Unterstützte Endpunkte | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Preisgestaltung
| Berechnen | Spezifikation | Zinssatz |
|---|---|---|
| Eingabe | pro 1M Prompt-Token | <=256K $0.165 (war $0.25); 256K-1M $0.66 (war $1.00) |
| Ausgabe | pro 1 Million generierter Token | <=256K $0.99 (war $1.50); 256K-1M $3.961 (war $4.00) |
| Websuche | pro Abfrage, wenn aktiviert | $0.01 |
Parameter
| Parameter | Typ | Erforderlich | Default | Beschreibung |
|---|---|---|---|---|
temperature | Anzahl | Nein | 0.7 | Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2 |
top_p | Anzahl | Nein | 0.9 | Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1 |
max_tokens | Anzahl | Nein | 4096 | Maximale Ausgabe-Token. · Reichweite: 1 – 65536 |
stop | String | Nein | - | Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren. |
enable_thinking | Boolean | Nein | Stimmt | Aktiviere das Schließen, bevor du antwortest. |
reasoning_effort | ENUM | Nein | "medium" | Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: none, low, medium, high, max |
thinking_budget | Anzahl | Nein | 32768 | Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 128.000 |
response_format | Gegenstand | Nein | - | OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat. Nutze den nicht-denkenden Modus für strenge Schemata. |
vl_high_resolution_images | Boolean | Nein | Stimmt | Verwenden Sie eine höher aufgelöste Verarbeitung für Bildeingaben. |
max_pixels | Anzahl | Nein | 2621440 | Maximale Pixelanzahl pro Bild, wenn hochauflösende Verarbeitung deaktiviert ist. · Reichweite: 4096 – 16777216 |
video_fps | Anzahl | Nein | 2 | Bilder pro Sekunde, um von Videoeingängen abzutasten. · Reichweite: 0,1 – 10 |
tool_web_search | Boolean | Nein | falsch | Suchen Sie im Internet nach Echtzeitinformationen. Das erhöht $0.01 auf die Anforderungskosten, wenn es aktiviert ist. |
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash.
