GLM 4.6V Flash | EmpirioLabs AI Docs

Z.ai · Text Generation

POST /v1/chat/completions

免费的多模态GLM-4.6V模型，支持图像、视频、文件和文本的理解，支持原生函数调用。

一眼看

场地	价值
型号ID	`glm-4-6v-flash`
车型发布日期	2025-12-08
输入模态	文本、图片、视频、文件
输出模态	正文
上下文窗口	128K
重量精度	-
最大输出令牌	32,768
地区	新加坡
特色	视力、video_understanding、document_understanding、function_calling、structured_output、web_search
本土推断	不
新	是的
支持的端点	`POST /v1/chat/completions`，`POST /v1/responses`，`POST /v1/messages`

定价

冲锋	规格	速率
输入	每100万个提示词标记	免费
输出	每100万个生成代币	免费
隐式缓存读取	每 1M 缓存输入标记	免费
网页搜索	启用时每个请求	$0.033

示例请求

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "glm-4-6v-flash", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数	类型	必修	默认	描述
`temperature`	人数	不	`1`	采样温度。较低的数值则更具确定性。GLM-4.7-闪存和GLM-4.6V闪存默认为1.0;GLM-4.5-闪存默认为0.6。·射程：0 – 1
`top_p`	人数	不	`0.95`	核抽样概率质量。Z.AI 文档中，GLM-4.7、GLM-4.6 和 GLM-4.5 系列默认为 0.95。·范围：0.01 – 1
`max_tokens`	人数	不	`4096`	GLM-4.6V闪存的最大输出令牌数：32768。·距离：1 – 32768
`stop`	数组	不	-	停止词列表。Z.AI 目前支持数组形式的单点字符串。
`do_sample`	布尔值	不	确实如此	启用采样。如果不确定，温度和top_p不会影响发电。
`enable_thinking`	布尔值	不	确实如此	控制控制，Z.AI 思考模式。启用是默认设置;GLM-4.6V闪光灯会自动决定是否启用。
`thinking`	对象	不	-	高级思维对象。请使用 {“type”：“enabled”} 或 {“type”：disabled“}。GLM-4.6V闪光灯会自动决定是否启用。
`response_format`	对象	不	-	将 {“type”：“json_object} 设置为 JSON 模式，或将 {”type“：”text} 设置为纯文本。
`tools`	数组	不	-	支持函数工具和内置web_search工具。
`tool_choice`	枚举	不	`"auto"`	控制模型是否可以使用工具。Z.AI 文档自动工具选择;省略禁用工具使用。·允许：`auto`
`tool_stream`	布尔值	不	错误	当流为真时，流函数调用工具输出。Z.AI 文档tool_stream GLM-4.6及更新型号。
`tool_web_search`	布尔值	不	错误	启用内置的网页搜索功能。启用后每个请求会增加$0.033个请求。
`search_result`	布尔值	不	确实如此	启用网页搜索时返回结构化的网页搜索结果元数据。
`search_prompt`	弦	不	-	可选的总结检索网页搜索结果的说明。
`count`	人数	不	`10`	需要检索的网络搜索结果数量。·范围：1 – 50
`search_domain_filter`	弦	不	-	可选的域名白名单用于网页搜索结果。
`search_recency_filter`	枚举	不	`"noLimit"`	可选的网络搜索窗口。·允许：`oneDay`、`oneWeek`、`oneMonth`、`oneYear`、`noLimit`

注释

基础代币使用免费。内置网页搜索通过tool_web_search为可选功能，启用后每个请求添加$0.033。

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/glm-4-6v-flash。