Qwen3.5 Flash | EmpirioLabs AI Docs

POST /v1/chat/completions

Vision-Sprachmodell mit hybrider linearer Aufmerksamkeit plus spärlicher MoE, 1M-Kontext und schneller multimodaler text/image-/Videoinferenz.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`qwen3-5-flash`
Modell-Veröffentlichungsdatum	2026-02-24
Eingabemodalitäten	Text, Bild, Video
Ausgabemodalitäten	Text
Kontextfenster	1M
Gewichtspräzision	-
Maximale Ausgabetoken	32,768
Region	Singapur
Merkmale	Vision, web_search, code_interpreter, function_calling
Native Schlussfolgerung	Nein
Neu	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$0.090 (war $0.10)
Ausgabe	pro 1 Million generierter Token	$0.368 (war $0.40)
Websuche	pro Aufruf	$0.015
Bildersuche	pro Aufruf	$0.012

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-5-flash", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.9`	Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Token in der Antwort. · Reichweite: 1 – 32768
`enable_thinking`	Boolean	Nein	Stimmt	Aktivieren Sie den erweiterten Denkmodus. Langsamere, aber verbesserte Aufgaben mit viel Schlussfolgerung.
`vl_high_resolution_images`	Boolean	Nein	Stimmt	Verwenden Sie für Eingabebilder eine höhere Auflösung. Bessere Details zu höheren Kosten.
`max_pixels`	Anzahl	Nein	`2621440`	Maximale Pixel pro Eingabebild. Größer = mehr Details, aber langsamer / mehr Token. · Reichweite: 1 – 99999999
`tool_web_search`	Boolean	Nein	falsch	Suchen Sie im Internet nach Echtzeitinformationen.
`tool_web_extractor`	Boolean	Nein	Stimmt	Extrahieren und lesen Sie Inhalte aus URLs. Erfordert Websuche und Nachdenken.
`tool_code_interpreter`	Boolean	Nein	Stimmt	Führe Python-Code in einer Sandbox aus. Erfordert Nachdenken.
`tool_web_search_image`	Boolean	Nein	Stimmt	Suchen Sie im Internet nach Bildern aus Textbeschreibungen.
`tool_image_search`	Boolean	Nein	Stimmt	Finden Sie ähnliche Bilder aus einem hochgeladenen Bild.
`video_fps`	Anzahl	Nein	`2`	Bilder pro Sekunde, die aus Eingabevideo zur Analyse abgeschnitten wurden. · Reichweite: 0,1 – 10
`treat_images_as_video`	Boolean	Nein	falsch	Behandle eine Sequenz von Eingabebildern als Video zur zeitlichen Überlegung.
`disable_formatting`	Boolean	Nein	falsch	Überspringe die EmpirioLabs Markdown-Formatierung (Zitation [N] Umschreiben + Referenzblock, wenn Websuche / Tools verwendet wurden). Die rohe Upstream-Antwort mit einfachen [N]-Zitaten wird zurückgegeben.

Anmerkungen

Eingebaute Werkzeuge (nur beim Aufruf abgerechnet)

Websuche: $0.015/call
Netzextraktor: kostenlos
Code-Interpreter: kostenlos
Text-zu-Bild-Suche: $0.012/call
Bild-zu-Bild-Suche: $0.012/call

Sonstiges

Denkende Tokens werden als Ausgabe-Tokens bezeichnet

Text-zu-Bild-Suche und Bild-zu-Bild-Suche verwenden die Preiszeile für Bildersuche. Jede ausgerufene Bildsuche wird zu dem angegebenen Preis pro Anruf berechnet.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell Werkzeuge (Websuche, Code-Interpreter usw.) innerhalb einer einzigen Anfrage aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Das untenstehende Beispiel zeigt die Form – genaue Feldnamen, Einheiten und welche Werkzeuge erscheinen, können je nach Anbieter leicht variieren:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

Die Anzahl der Werkzeuge ist bereits in cost_usd einbezogen – sie sind zur Transparenz sichtbar, damit man die Rechnungsabrechnung pro Tool prüfen kann. Das Feld wird weggelassen, wenn keine Werkzeuge aktiviert wurden.

Varianten

`:variant1`

Spielfeld	Wert
Modell-ID	`qwen3-5-flash:variant1`
Modell-Veröffentlichungsdatum	2026-02-24
Region	China
Kontextfenster	1M
Gewichtspräzision	-
Maximale Ausgabetoken	65,536
Merkmale	Vernunft, Vision, Video, web_search, function_calling, structured_output, agentic_coding
Native Schlussfolgerung	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	<=128K $0.029 (war $0.090); 128K-256K $0.115; 256K-1M $0.172
Ausgabe	pro 1 Million generierter Token	<=128K $0.287 (war $0.368); 128K-256K $1.147; 256K-1M $1.72
Websuche	pro Abfrage, wenn aktiviert	$0.01

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.9`	Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Ausgabe-Token. · Reichweite: 1 – 65536
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`enable_thinking`	Boolean	Nein	Stimmt	Aktiviere das Schließen, bevor du antwortest.
`reasoning_effort`	ENUM	Nein	`"medium"`	Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. Gesendet als OpenAI-ähnliches reasoning_effort Feld, übersetzt in enable_thinking und thinking_budget für den Modelldienst. · Erlaubt: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Anzahl	Nein	`32768`	Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 80.000
`response_format`	Gegenstand	Nein	-	OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat. Nutze den nicht-denkenden Modus für strenge Schemata.
`vl_high_resolution_images`	Boolean	Nein	Stimmt	Verwenden Sie eine höher aufgelöste Verarbeitung für Bildeingaben.
`max_pixels`	Anzahl	Nein	`2621440`	Maximale Pixelanzahl pro Bild, wenn hochauflösende Verarbeitung deaktiviert ist. · Reichweite: 4096 – 16777216
`video_fps`	Anzahl	Nein	`2`	Bilder pro Sekunde, um von Videoeingängen abzutasten. · Reichweite: 0,1 – 10
`tool_web_search`	Boolean	Nein	falsch	Suchen Sie im Internet nach Echtzeitinformationen. Das erhöht $0.01 auf die Anforderungskosten, wenn es aktiviert ist.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-5-flash.