Qwen3.6 Flash

Qwen3.6 Flash
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Fast Qwen3.6视觉语言模型,用于智能编码、数学推理、空间理解、OCR以及文本、图像和视频输入。

一眼看

场地价值
型号IDqwen3-6-flash
车型发布日期2026-04-16
输入模态文本、图像、视频
输出模态正文
上下文窗口1M
重量精度-
最大输出令牌65,536
地区新加坡
特色推理、视觉、视频、web_search、function_calling、structured_output、agentic_coding
本土推断
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记<=256K $0.25;256K-1M $1.00
输出每100万个生成代币<=256K $1.50;256K-1M $4.00
网络搜索启用时每个查询$0.02

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度。0是确定性的,2是最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1
max_tokens人数4096最大输出令牌。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
enable_thinking布尔值确实如此在回答之前先启用推理。
reasoning_effort枚举"medium"推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送,转换为模型服务的enable_thinking和thinking_budget。·允许:nonelowmediumhighmax
thinking_budget人数32768开启了思考时保留给推理的最大代币。·范围:1 – 64000
response_format对象-兼容 OpenAI 的 JSON 模式或 JSON 模式响应格式。严格的图式则使用非思考模式。
vl_high_resolution_images布尔值确实如此图像输入使用更高分辨率处理。
max_pixels人数2621440禁用高分辨率处理时,每张图像的最大像素数。·距离:4096 – 16777216
video_fps人数2每秒帧以从视频输入采样。·范围:0.1 – 10
tool_web_search布尔值错误在网上搜索实时信息。启用后会增加$0.02请求费用。

注释

支持文本、图像和视频输入。网页搜索可通过tool_web_search提供,启用时每个查询会添加$0.02。思考代币作为输出代币计费。不支持显式缓存控制。

变体

:variant1

场地价值
型号IDqwen3-6-flash:variant1
车型发布日期2026-04-16
地区中国
上下文窗口1M
重量精度-
最大输出令牌65,536
特色推理、视觉、视频、web_search、function_calling、structured_output、agentic_coding
本土推断
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

价格

冲锋规格速率
输入每100万个提示词标记<=256K $0.165(曾为$0.25);256K-1M $0.66(曾是$1.00)
输出每100万个生成代币<=256K $0.99(曾为$1.50);256K-1M $3.961(曾是$4.00)
网络搜索启用时每个查询$0.01

参数

参数类型必修默认描述
temperature人数0.7采样温度。0是确定性的,2是最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1
max_tokens人数4096最大输出令牌。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
enable_thinking布尔值确实如此在回答之前先启用推理。
reasoning_effort枚举"medium"推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送,转换为模型服务的enable_thinking和thinking_budget。·允许:nonelowmediumhighmax
thinking_budget人数32768开启了思考时保留给推理的最大代币。·范围:1 – 128000
response_format对象-兼容 OpenAI 的 JSON 模式或 JSON 模式响应格式。严格的图式则使用非思考模式。
vl_high_resolution_images布尔值确实如此图像输入使用更高分辨率处理。
max_pixels人数2621440禁用高分辨率处理时,每张图像的最大像素数。·距离:4096 – 16777216
video_fps人数2每秒帧以从视频输入采样。·范围:0.1 – 10
tool_web_search布尔值错误在网上搜索实时信息。启用后会增加$0.01请求费用。

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash