Qwen3 Max

Qwen3 Max
Alibaba Cloud · Text Generation
POST /v1/chat/completions

256K上下文旗舰机,在推理、指令跟随和多语言支持方面有显著提升,coding/math准确性更高。

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

一眼看

场地价值
型号IDqwen3-max
车型发布日期2025-09-23
输入模态正文
输出模态正文
上下文窗口256K
重量精度-
最大输出令牌65,536
地区新加坡
特色理由,code_interpreter,web_search
本土推断
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages
退役日期2026-09-08

定价

冲锋规格速率
输入每100万个提示词标记<=32K $1.08(曾为$1.20);32K-128K $2.16(曾是$2.40);128K-256K $2.70(曾是$3.00)
输出每100万个生成代币<=32K $5.52(曾为$6.00);32K-128K $11.04(曾是$12.00);128K-256K $13.80(曾是$15.00)
网页搜索按请求$0.015

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-max", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度。0 = 确定性,2 = 最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。低 = 更专注。·射程:0 – 1
max_tokens人数4096回复中最多的代币。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
tool_web_search布尔值错误在网上搜索实时信息。
disable_formatting布尔值错误跳过EmpirioLabs的Markdown格式化(引用[[N]](URL)重写+使用网页搜索/工具时的参考资料块)。返回原始上游答案,带有纯[N]次引用。

注释

可选的网页搜索在调用时添加$0.015/call。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/qwen3-max