Qwen3.6 Flash

Alibaba Cloud · Text Generation
POST /v1/chat/completionsFast Qwen3.6视觉语言模型,用于智能编码、数学推理、空间理解、OCR以及文本、图像和视频输入。
一眼看
| 场地 | 价值 |
|---|---|
| 型号ID | qwen3-6-flash |
| 车型发布日期 | 2026-04-16 |
| 输入模态 | 文本、图像、视频 |
| 输出模态 | 正文 |
| 上下文窗口 | 1M |
| 重量精度 | - |
| 最大输出令牌 | 65,536 |
| 地区 | 新加坡 |
| 特色 | 推理、视觉、视频、web_search、function_calling、structured_output、agentic_coding |
| 本土推断 | 不 |
| 新 | 是的 |
| 支持的端点 | POST /v1/chat/completions,POST /v1/responses,POST /v1/messages |
定价
| 冲锋 | 规格 | 速率 |
|---|---|---|
| 输入 | 每100万个提示词标记 | <=256K $0.25;256K-1M $1.00 |
| 输出 | 每100万个生成代币 | <=256K $1.50;256K-1M $4.00 |
| 网络搜索 | 启用时每个查询 | $0.02 |
示例请求
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'
参数
| 参数 | 类型 | 必修 | 默认 | 描述 |
|---|---|---|---|---|
temperature | 人数 | 不 | 0.7 | 采样温度。0是确定性的,2是最大随机性。·射程:0 – 2 |
top_p | 人数 | 不 | 0.9 | 核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1 |
max_tokens | 人数 | 不 | 4096 | 最大输出令牌。·距离:1 – 65536 |
stop | 弦 | 不 | - | 最多有4串字符串,模型会停止生成更多代币。 |
enable_thinking | 布尔值 | 不 | 确实如此 | 在回答之前先启用推理。 |
reasoning_effort | 枚举 | 不 | "medium" | 推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送,转换为模型服务的enable_thinking和thinking_budget。·允许:none、low、medium、high、max |
thinking_budget | 人数 | 不 | 32768 | 开启了思考时保留给推理的最大代币。·范围:1 – 64000 |
response_format | 对象 | 不 | - | 兼容 OpenAI 的 JSON 模式或 JSON 模式响应格式。严格的图式则使用非思考模式。 |
vl_high_resolution_images | 布尔值 | 不 | 确实如此 | 图像输入使用更高分辨率处理。 |
max_pixels | 人数 | 不 | 2621440 | 禁用高分辨率处理时,每张图像的最大像素数。·距离:4096 – 16777216 |
video_fps | 人数 | 不 | 2 | 每秒帧以从视频输入采样。·范围:0.1 – 10 |
tool_web_search | 布尔值 | 不 | 错误 | 在网上搜索实时信息。启用后会增加$0.02请求费用。 |
注释
支持文本、图像和视频输入。网页搜索可通过tool_web_search提供,启用时每个查询会添加$0.02。思考代币作为输出代币计费。不支持显式缓存控制。
变体
:variant1
| 场地 | 价值 |
|---|---|
| 型号ID | qwen3-6-flash:variant1 |
| 车型发布日期 | 2026-04-16 |
| 地区 | 中国 |
| 上下文窗口 | 1M |
| 重量精度 | - |
| 最大输出令牌 | 65,536 |
| 特色 | 推理、视觉、视频、web_search、function_calling、structured_output、agentic_coding |
| 本土推断 | 不 |
| 支持的端点 | POST /v1/chat/completions,POST /v1/responses,POST /v1/messages |
价格
| 冲锋 | 规格 | 速率 |
|---|---|---|
| 输入 | 每100万个提示词标记 | <=256K $0.165(曾为$0.25);256K-1M $0.66(曾是$1.00) |
| 输出 | 每100万个生成代币 | <=256K $0.99(曾为$1.50);256K-1M $3.961(曾是$4.00) |
| 网络搜索 | 启用时每个查询 | $0.01 |
参数
| 参数 | 类型 | 必修 | 默认 | 描述 |
|---|---|---|---|---|
temperature | 人数 | 不 | 0.7 | 采样温度。0是确定性的,2是最大随机性。·射程:0 – 2 |
top_p | 人数 | 不 | 0.9 | 核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1 |
max_tokens | 人数 | 不 | 4096 | 最大输出令牌。·距离:1 – 65536 |
stop | 弦 | 不 | - | 最多有4串字符串,模型会停止生成更多代币。 |
enable_thinking | 布尔值 | 不 | 确实如此 | 在回答之前先启用推理。 |
reasoning_effort | 枚举 | 不 | "medium" | 推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送,转换为模型服务的enable_thinking和thinking_budget。·允许:none、low、medium、high、max |
thinking_budget | 人数 | 不 | 32768 | 开启了思考时保留给推理的最大代币。·范围:1 – 128000 |
response_format | 对象 | 不 | - | 兼容 OpenAI 的 JSON 模式或 JSON 模式响应格式。严格的图式则使用非思考模式。 |
vl_high_resolution_images | 布尔值 | 不 | 确实如此 | 图像输入使用更高分辨率处理。 |
max_pixels | 人数 | 不 | 2621440 | 禁用高分辨率处理时,每张图像的最大像素数。·距离:4096 – 16777216 |
video_fps | 人数 | 不 | 2 | 每秒帧以从视频输入采样。·范围:0.1 – 10 |
tool_web_search | 布尔值 | 不 | 错误 | 在网上搜索实时信息。启用后会增加$0.01请求费用。 |
Machine可读模式: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash。
