Qwen3.7 Max

Qwen3.7 Max
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Qwen3.7 Max ist ein Flaggschiff-Textmodell für Coding, Produktivität, langlaufende Agenten, tiefes Denken, Werkzeuge und 1M-Token-Kontext.

Auf einen Blick

SpielfeldWert
Modell-IDqwen3-7-max
Modell-Veröffentlichungsdatum2026-05-21
EingabemodalitätenText
AusgabemodalitätenText
Kontextfenster1M
Gewichtspräzision-
Maximale Ausgabetoken65,536
RegionSingapur
MerkmaleVernunft, web_search, code_interpreter, function_calling, agentic_coding
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$2.50
Ausgabepro 1 Million generierter Token$7.50
Websuchepro Aufruf beim Aufruf$0.02
Netzextraktorpro Aufruf beim Aufruf$0.02
Code-Interpreterpro Aufruf beim Aufruf$0.02

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 65536
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
enable_thinkingBooleanNeinStimmtAktiviere das Schließen, bevor du antwortest.
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. · Erlaubt: none, low, medium, high, max
thinking_budgetAnzahlNein32768Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 64.000
tool_web_searchBooleanNeinfalschSuchen Sie im Internet nach Echtzeitinformationen. Fügt $0.02 die Anfragekosten für jeden aufgerufenen Websuchaufruf hinzu.
tool_web_extractorBooleanNeinfalschExtrahieren und lesen Sie Inhalte aus URLs. Erfordert Websuche und Nachdenken. Fügt $0.02 die Anforderungskosten für jeden aufgerufenen Web-Extractor-Aufruf hinzu.
tool_code_interpreterBooleanNeinfalschFühre Python-Code in einer Sandbox aus. Erfordert Nachdenken. Fügt $0.02 zu den Anforderungskosten für jeden aufgerufenen Code-Interpreter-Aufruf hinzu.
disable_formattingBooleanNeinfalschRohe Ausgaben im Provider-Stil ohne EmpirioLabs-Quellformatierung, wo unterstützt, zurückgeben.

Anmerkungen

Nur Texteingabe. Websuche, Web-Extractor und Code-Interpreter sind optionale integrierte Tools, die über tool_*-Parameter bereitgestellt werden. Jeder eingebaute Toolaufruf fügt beim Aufruf $0.02 hinzu. Thinking Tokens werden als Output Tokens beworben.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell in einer einzigen Anfrage eingebaute Werkzeuge aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Die Werkzeuganzahl wird bereits in cost_usd einbezogen und zur Transparenz angezeigt.

Varianten

:variant1

SpielfeldWert
Modell-IDqwen3-7-max:variant1
Modell-Veröffentlichungsdatum2026-05-21
RegionChina
Kontextfenster1M
Gewichtspräzision-
Maximale Ausgabetoken65,536
MerkmaleVernunft, web_search, code_interpreter, function_calling, agentic_coding
Native SchlussfolgerungNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$1.65 (war $2.50)
Ausgabepro 1 Million generierter Token$4.951 (war $7.50)
Websuchepro Aufruf beim Aufruf$0.01
Netzextraktorpro Aufruf beim Aufruf$0.01
Code-Interpreterpro Aufruf beim Aufruf$0.01

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 ist deterministisch und 2 ist maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedrigere Werte machen die Ausgaben fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 65536
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
enable_thinkingBooleanNeinStimmtAktiviere das Schließen, bevor du antwortest.
reasoning_effortENUMNein"medium"Der Aufwand des Schlussfolgerungsaufwands. Keiner verhindert das Denken. Niedrige, mittlere, hohe und maximale begrenzte Denkbudgets, die auf das gewählte Modell zugeschnitten sind. · Erlaubt: none, low, medium, high, max
thinking_budgetAnzahlNein32768Maximale Token, die für das Denken beim Denken reserviert sind, ist aktiviert. · Reichweite: 1 – 64.000
tool_web_searchBooleanNeinfalschSuchen Sie im Internet nach Echtzeitinformationen. Fügt $0.01 die Anfragekosten für jeden aufgerufenen Websuchaufruf hinzu.
tool_web_extractorBooleanNeinfalschExtrahieren und lesen Sie Inhalte aus URLs. Erfordert Websuche und Nachdenken. Fügt $0.01 die Anforderungskosten für jeden aufgerufenen Web-Extractor-Aufruf hinzu.
tool_code_interpreterBooleanNeinfalschFühre Python-Code in einer Sandbox aus. Erfordert Nachdenken. Fügt $0.01 zu den Anforderungskosten für jeden aufgerufenen Code-Interpreter-Aufruf hinzu.
disable_formattingBooleanNeinfalschRohe Ausgaben im Provider-Stil ohne EmpirioLabs-Quellformatierung, wo unterstützt, zurückgeben.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max.