Qwen3.5 Plus

Qwen3.5 Plus
Alibaba Cloud · Text Generation
POST /v1/chat/completions

采用多模态模型,采用混合架构,在100万上下文中实现文本、图像和视频的高效深度思考和视觉理解。

一眼看

场地价值
型号IDqwen3-5-plus
车型发布日期2026-02-16
输入模态文本、图像、视频
输出模态正文
上下文窗口1M
重量精度-
最大输出令牌65,536
地区新加坡
特色视觉、视web_search、code_interpreter、理function_calling、推理
本土推断
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记<=256K $0.36(曾为$0.40);256K-1M $1.08(曾是$1.20)
输出每100万个生成代币<=256K $2.21(曾为$2.40);256K-1M $6.62(曾是$7.20)
网页搜索每次通话$0.015
图片搜索每次通话$0.012

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-5-plus", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度。0 = 确定性,2 = 最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。低 = 更专注。·射程:0 – 1
max_tokens人数4096回复中最多的代币。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
vl_high_resolution_images布尔值确实如此输入图像使用更高分辨率。细节更好,成本更高。
enable_thinking布尔值确实如此启用扩展思考模式。虽然节奏较慢,但能提升推理性任务。
max_pixels人数2621440每张输入图像的最大像素数。更大=细节更多但速度慢/标记更多。·射程:1 – 99999999
tool_web_search布尔值错误在网上搜索实时信息。
tool_web_extractor布尔值确实如此从URL中提取并读取内容。需要网络搜索和思考。
tool_code_interpreter布尔值确实如此在沙盒中运行Python代码。需要思考。
tool_web_search_image布尔值确实如此在网上搜索文本描述中的图片。
tool_image_search布尔值确实如此从上传的图片中寻找相似图片。
video_fps人数2从输入视频中采样的帧每秒进行分析。·范围:0.1 – 10
treat_images_as_video布尔值错误将一组输入图像当作视频来进行时间推理。
disable_formatting布尔值错误跳过EmpirioLabs的Markdown格式化(引用[[N]](URL)重写+使用网页搜索/工具时的参考资料块)。返回原始上游答案,带有纯[N]次引用。

注释

超过256K代币的input/output价格为3倍。内置工具(网页搜索、网页提取器、代码解释器、图片搜索)仅在被调用时计费。

文本转图像搜索和图像对图像搜索使用图片搜索定价行。每次调用的图像搜索按上述每次通话的费率计费。

按工具计费(usage.tool_usage

当该模型在单一请求中调用工具(如网页搜索、代码解释器等)时,响应会携带一个归一化的usage.tool_usage映射,同时显示令牌计数。下面的示例展示了形状 - - 具体字段名称、单位以及出现的工具可能因提供者而略有差异:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

工具数量已经被纳入cost_usd - - 它们被展示出来以保持透明,以便你审计每件工具的计费。当没有工具被调用时,该字段被省略。

变体

:variant1

场地价值
型号IDqwen3-5-plus:variant1
车型发布日期2026-02-16
地区中国
上下文窗口1M
重量精度-
最大输出令牌65,536
特色推理、视觉、视频、web_search、function_calling、structured_output、agentic_coding
本土推断
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

价格

冲锋规格速率
输入每100万个提示词标记<=128K $0.115(是$0.36);128K-256K $0.287(曾是$0.36);256K-1M $0.573(曾是$1.08)
输出每100万个生成代币<=128K $0.688(是$2.21);128K-256K $1.72(曾是$2.21);256K-1M $3.44(曾是$6.62)
网络搜索启用时每个查询$0.01

参数

参数类型必修默认描述
temperature人数0.7采样温度。0是确定性的,2是最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1
max_tokens人数4096最大输出令牌。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
enable_thinking布尔值确实如此在回答之前先启用推理。
reasoning_effort枚举"medium"推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送,转换为模型服务的enable_thinking和thinking_budget。·允许:nonelowmediumhighmax
thinking_budget人数32768开启了思考时保留给推理的最大代币。·范围:1 – 80000
response_format对象-兼容 OpenAI 的 JSON 模式或 JSON 模式响应格式。严格的图式则使用非思考模式。
vl_high_resolution_images布尔值确实如此图像输入使用更高分辨率处理。
max_pixels人数2621440禁用高分辨率处理时,每张图像的最大像素数。·距离:4096 – 16777216
video_fps人数2每秒帧以从视频输入采样。·范围:0.1 – 10
tool_web_search布尔值错误在网上搜索实时信息。启用后会增加$0.01请求费用。

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/qwen3-5-plus