Qwen3.6 Max Preview

Qwen3.6 Max Preview
Alibaba Cloud · Text Generation
POST /v1/chat/completions

3.6系列(仅文本)中最大的预览变体:改进了编码代理执行,增强了前端技能,以及更广泛的长尾知识。

This model is deprecated and will be retired on 2026-09-08. After that date, requests to this model will fail. Migrate to a successor model before then.

一眼看

场地价值
型号IDqwen3-6-max-preview
车型发布日期2026-04-20
输入模态正文
输出模态正文
上下文窗口256K
重量精度-
最大输出令牌65,536
地区新加坡
特色理由,agentic_coding,web_search
本土推断
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages
退役日期2026-09-08

定价

冲锋规格速率
输入每100万个提示词标记<=128K $1.31;128K-256K $1.97
输出每100万个生成代币<=128K $7.88;128K-256K $11.82
网页搜索每次通话$0.020

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-max-preview", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度·射程:0 – 2
top_p人数1.0核采样 ·射程:0 – 1
max_tokens人数4096最大输出令牌 ·距离:1 – 65536
frequency_penalty人数0重复使用代币的惩罚。>0减少重复,<0鼓励重复。·射程:-2 – 2
presence_penalty人数0新标记与已见标记的惩罚。>0鼓励新话题,<0鼓励保持主题。·射程:-2 – 2
reasoning_effort枚举"medium"推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送,转换为模型服务的enable_thinking和thinking_budget。·允许:nonelowmediumhighmax
stop-逗号分隔的塞音序列
enable_thinking布尔值确实如此回答前先step-by-step理由
thinking_budget人数32768保留用于思考的代币·射程:1 – 393216
tool_web_search布尔值错误在网上搜索实时信息。
disable_formatting布尔值错误跳过EmpirioLabs的Markdown格式化(引用[[N]](URL)重写+使用网页搜索/工具时的参考资料块)。返回原始上游答案,带有纯[N]次引用。

注释

价格是12.8K代币的~1.5倍。本次预览仅支持纯文本功能;多模态尚未启用。

按工具计费(usage.tool_usage

当该模型在单一请求中调用工具(如网页搜索、代码解释器等)时,响应会携带一个归一化的usage.tool_usage映射,同时显示令牌计数。下面的示例展示了形状 - - 具体字段名称、单位以及出现的工具可能因提供者而略有差异:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

工具数量已经被纳入cost_usd - - 它们被展示出来以保持透明,以便你审计每件工具的计费。当没有工具被调用时,该字段被省略。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/qwen3-6-max-preview