Qwen3.7 Max | EmpirioLabs AI Docs

POST /v1/chat/completions

Qwen3.7 Max ist ein Flaggschiff-Textmodell für Coding, Produktivität, langlaufende Agenten, tiefes Denken, Werkzeuge und 1M-Token-Kontext.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`qwen3-7-max`
Modell-Veröffentlichungsdatum	2026-05-21
Eingabemodalitäten	Text
Ausgabemodalitäten	Text
Kontextfenster	1M
Gewichtspräzision	-
Maximale Ausgabetoken	65,536
Region	Singapur
Merkmale	Vernunft, web_search, code_interpreter, function_calling, agentic_coding
Native Schlussfolgerung	Nein
Neu	Ja
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$2.50
Ausgabe	pro 1 Million generierter Token	$7.50
Websuche	pro Aufruf beim Aufruf	$0.02
Netzextraktor	pro Aufruf beim Aufruf	$0.02
Code-Interpreter	pro Aufruf beim Aufruf	$0.02

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.9`	Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Ausgabe-Token. · Reichweite: 1 – 65536
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`enable_thinking`	Boolean	Nein	Stimmt	Aktiviere das Schließen, bevor du antwortest.
`reasoning_effort`	ENUM	Nein	`"medium"`	Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. · Erlaubt: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Anzahl	Nein	`32768`	Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 64.000
`tool_web_search`	Boolean	Nein	falsch	Suchen Sie im Internet nach Echtzeitinformationen. Fügt $0.02 die Anfragekosten für jeden aufgerufenen Websuchaufruf hinzu.
`tool_web_extractor`	Boolean	Nein	falsch	Extrahieren und lesen Sie Inhalte aus URLs. Erfordert Websuche und Nachdenken. Fügt $0.02 die Anforderungskosten für jeden aufgerufenen Web-Extractor-Aufruf hinzu.
`tool_code_interpreter`	Boolean	Nein	falsch	Führe Python-Code in einer Sandbox aus. Erfordert Nachdenken. Fügt $0.02 zu den Anforderungskosten für jeden aufgerufenen Code-Interpreter-Aufruf hinzu.
`disable_formatting`	Boolean	Nein	falsch	Rohe Ausgaben im Provider-Stil ohne EmpirioLabs-Quellformatierung, wo unterstützt, zurückgeben.

Anmerkungen

Nur Texteingabe. Websuche, Web-Extractor und Code-Interpreter sind optionale integrierte Tools, die über tool_*-Parameter bereitgestellt werden. Jeder eingebaute Toolaufruf fügt beim Aufruf $0.02 hinzu. Thinking Tokens werden als Output Tokens beworben.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell in einer einzigen Anfrage eingebaute Werkzeuge aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Die Werkzeuganzahl wird bereits in cost_usd einbezogen und zur Transparenz angezeigt.

Varianten

`:variant1`

Spielfeld	Wert
Modell-ID	`qwen3-7-max:variant1`
Modell-Veröffentlichungsdatum	2026-05-21
Region	China
Kontextfenster	1M
Gewichtspräzision	-
Maximale Ausgabetoken	65,536
Merkmale	Vernunft, web_search, code_interpreter, function_calling, agentic_coding
Native Schlussfolgerung	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$1.65 (war $2.50)
Ausgabe	pro 1 Million generierter Token	$4.951 (war $7.50)
Websuche	pro Aufruf beim Aufruf	$0.01
Netzextraktor	pro Aufruf beim Aufruf	$0.01
Code-Interpreter	pro Aufruf beim Aufruf	$0.01

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.9`	Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Ausgabe-Token. · Reichweite: 1 – 65536
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`enable_thinking`	Boolean	Nein	Stimmt	Aktiviere das Schließen, bevor du antwortest.
`reasoning_effort`	ENUM	Nein	`"medium"`	Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. · Erlaubt: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Anzahl	Nein	`32768`	Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 64.000
`tool_web_search`	Boolean	Nein	falsch	Suchen Sie im Internet nach Echtzeitinformationen. Fügt $0.01 die Anfragekosten für jeden aufgerufenen Websuchaufruf hinzu.
`tool_web_extractor`	Boolean	Nein	falsch	Extrahieren und lesen Sie Inhalte aus URLs. Erfordert Websuche und Nachdenken. Fügt $0.01 die Anforderungskosten für jeden aufgerufenen Web-Extractor-Aufruf hinzu.
`tool_code_interpreter`	Boolean	Nein	falsch	Führe Python-Code in einer Sandbox aus. Erfordert Nachdenken. Fügt $0.01 zu den Anforderungskosten für jeden aufgerufenen Code-Interpreter-Aufruf hinzu.
`disable_formatting`	Boolean	Nein	falsch	Rohe Ausgaben im Provider-Stil ohne EmpirioLabs-Quellformatierung, wo unterstützt, zurückgeben.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max.