Qwen3.5 35B-A3B | EmpirioLabs AI Docs

POST /v1/chat/completions

Qwen3.5 35B-A3B 是一个高效的原生视觉语言模型，拥有稀疏的 MoE 路由、深度思考以及文本、图像和视频输入。

一眼看

场地	价值
型号ID	`qwen3-5-35b-a3b`
车型发布日期	2026-02-24
输入模态	文本、图像、视频
输出模态	正文
上下文窗口	256K
重量精度	-
最大输出令牌	64,000
地区	中国
特色	推理、视觉、web_search、function_calling、structured_output、多模态
本土推断	不
新	是的
支持的端点	`POST /v1/chat/completions`，`POST /v1/responses`，`POST /v1/messages`

定价

冲锋	规格	速率
输入	每100万个提示词标记	<=128K $0.057（是$0.25）;128K-256K $0.229（曾是$0.25）
输出	每100万个生成代币	<=128K $0.459（是$2.00）;128K-256K $1.835（曾是$2.00）
网络搜索	启用时每个请求	$0.01

示例请求

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-5-35b-a3b", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数	类型	必修	默认	描述
`temperature`	人数	不	`0.7`	采样温度。0是确定性的，2是最大随机性。·射程：0 – 2
`top_p`	人数	不	`0.9`	核抽样概率质量。较低的数值使输出更集中。·射程：0 – 1
`max_tokens`	人数	不	`4096`	最大输出令牌。·范围：1 – 64000
`stop`	弦	不	-	最多有4串字符串，模型会停止生成更多代币。
`enable_thinking`	布尔值	不	确实如此	在回答之前先启用推理。
`reasoning_effort`	枚举	不	`"medium"`	推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送，转换为模型服务的enable_thinking和thinking_budget。·允许：`none`、`low`、`medium`、`high`、`max`
`thinking_budget`	人数	不	`32768`	开启了思考时保留给推理的最大代币。·范围：1 – 80000
`vl_high_resolution_images`	布尔值	不	确实如此	图像输入使用更高分辨率处理。
`max_pixels`	人数	不	`2621440`	禁用高分辨率处理时，每张图像的最大像素数。·距离：4096 – 16777216
`video_fps`	人数	不	`2`	每秒帧以从视频输入采样。·范围：0.1 – 10
`tool_web_search`	布尔值	不	错误	在网上搜索实时信息。启用后会增加$0.01请求费用。

注释

支持文本、图像和视频输入。通过tool_web_search提供网页搜索，启用后每个请求添加$0.01。思考代币作为输出代币计费。

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/qwen3-5-35b-a3b。