Qwen3 Max Thinking

POST /v1/chat/completions

推理模型，采用自适应工具（搜索、内存、代码解释器）和测试时间缩放，以提升复杂任务的准确性。

This model is deprecated and will be retired on 2026-07-08. After that date, requests to this model will fail. Migrate to a successor model before then.

一眼看

场地	价值
型号ID	`qwen3-max-thinking`
车型发布日期	2025-09-23
输入模态	正文
输出模态	正文
上下文窗口	256K
重量精度	-
最大输出令牌	65,536
地区	新加坡
特色	推理、code_interpreter、web_search、思考
本土推断	不
新	不
支持的端点	`POST /v1/chat/completions`，`POST /v1/responses`，`POST /v1/messages`
退役日期	2026-07-08

定价

冲锋	规格	速率
输入	每100万个提示词标记	<=32K $1.08（曾为$1.20）;32K-128K $2.16（曾是$2.40）;128K-256K $2.70（曾是$3.00）
输出	每100万个生成代币	<=32K $5.52（曾为$6.00）;32K-128K $11.04（曾是$12.00）;128K-256K $13.80（曾是$15.00）
网页搜索	按请求	$0.015

示例请求

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-max-thinking", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数	类型	必修	默认	描述
`temperature`	人数	不	`0.7`	采样温度。0 = 确定性，2 = 最大随机性。·射程：0 – 2
`top_p`	人数	不	`0.9`	核抽样概率质量。低 = 更专注。·射程：0 – 1
`max_tokens`	人数	不	`4096`	回复中最多的代币。·距离：1 – 65536
`stop`	弦	不	-	最多有4串字符串，模型会停止生成更多代币。
`enable_thinking`	布尔值	不	确实如此	启用扩展思考模式。虽然节奏较慢，但能提升推理性任务。
`tool_web_search`	布尔值	不	错误	允许模型在需要时进行网页搜索。
`web_search_mode`	枚举	不	`"standard"`	标准 = 单次搜索，彻底搜索 = 多次深入搜索。·允许：`standard`，`thorough`
`tool_code_interpreter`	布尔值	不	确实如此	允许模型在沙盒中执行Python代码来计算和分析数据。
`tool_web_extractor`	布尔值	不	确实如此	允许模型从发现的URL中获取和读取内容。
`disable_formatting`	布尔值	不	错误	跳过EmpirioLabs的Markdown格式化（引用[[N]]（URL）重写+使用网页搜索/工具时的参考资料块）。返回原始上游答案，带有纯[N]次引用。

注释

网络搜索模式：标准（高效）或全面（全面，需要思考）。

按工具计费（usage.tool_usage）

当该模型在单一请求中调用工具（如网页搜索、代码解释器等）时，响应会携带一个归一化的usage.tool_usage映射，同时显示令牌计数。下面的示例展示了形状 - - 具体字段名称、单位以及出现的工具可能因提供者而略有差异：

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

工具数量已经被纳入cost_usd - - 它们被展示出来以保持透明，以便你审计每件工具的计费。当没有工具被调用时，该字段被省略。

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/qwen3-max-thinking。