Qwen3.7 Max

Qwen3.7 Max
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Qwen3.7 Max 是编码、生产力、长期运行代理、深度思考、工具和 100 万令牌上下文的旗舰文本模型。

一眼看

场地价值
型号IDqwen3-7-max
车型发布日期2026-05-21
输入模态正文
输出模态正文
上下文窗口1M
重量精度-
最大输出令牌65,536
地区新加坡
特色推理、web_search、code_interpreter、function_calling、agentic_coding
本土推断
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记$2.50
输出每100万个生成代币$7.50
网络搜索每次调用时$0.02
网页提取器每次调用时$0.02
代码解释器每次调用时$0.02

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度。0是确定性的,2是最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1
max_tokens人数4096最大输出令牌。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
enable_thinking布尔值确实如此在回答之前先启用推理。
reasoning_effort枚举"medium"推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。·允许:nonelowmediumhighmax
thinking_budget人数32768开启了思考时保留给推理的最大代币。·范围:1 – 64000
tool_web_search布尔值错误在网上搜索实时信息。每次调用的网络搜索调用的请求成本增加了$0.02。
tool_web_extractor布尔值错误从URL中提取并读取内容。需要网络搜索和思考。每次调用的网页提取调用都会增加$0.02请求成本。
tool_code_interpreter布尔值错误在沙盒中运行Python代码。需要思考。每次调用的代码解释器调用都会增加$0.02请求成本。
disable_formatting布尔值错误在支持的情况下返回原始提供者格式,不使用EmpirioLabs源格式。

注释

只输入文字。网页搜索、网页提取器和代码解释器是可选的内置工具,通过tool_*参数暴露。每个内置工具调用在调用时都会增加$0.02。思考代币作为输出代币计费。

按工具计费(usage.tool_usage

当该模型在单一请求中调用内置工具时,响应会携带归一化后的usage.tool_usage映射,同时显示令牌计数。工具数量已经被纳入cost_usd并以表面显示以保证透明度。

变体

:variant1

场地价值
型号IDqwen3-7-max:variant1
车型发布日期2026-05-21
地区中国
上下文窗口1M
重量精度-
最大输出令牌65,536
特色推理、web_search、code_interpreter、function_calling、agentic_coding
本土推断
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

价格

冲锋规格速率
输入每100万个提示词标记$1.65(曾经$2.50)
输出每100万个生成代币$4.951(曾经$7.50)
网络搜索每次调用时$0.01
网页提取器每次调用时$0.01
代码解释器每次调用时$0.01

参数

参数类型必修默认描述
temperature人数0.7采样温度。0是确定性的,2是最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1
max_tokens人数4096最大输出令牌。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
enable_thinking布尔值确实如此在回答之前先启用推理。
reasoning_effort枚举"medium"推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。·允许:nonelowmediumhighmax
thinking_budget人数32768开启了思考时保留给推理的最大代币。·范围:1 – 64000
tool_web_search布尔值错误在网上搜索实时信息。每次调用的网络搜索调用的请求成本增加了$0.01。
tool_web_extractor布尔值错误从URL中提取并读取内容。需要网络搜索和思考。每次调用的网页提取调用都会增加$0.01请求成本。
tool_code_interpreter布尔值错误在沙盒中运行Python代码。需要思考。每次调用的代码解释器调用都会增加$0.01请求成本。
disable_formatting布尔值错误在支持的情况下返回原始提供者格式,不使用EmpirioLabs源格式。

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max