GLM 4.6V Flash

GLM 4.6V Flash
Z.ai · Text Generation
POST /v1/chat/completions

免费的多模态GLM-4.6V模型,支持图像、视频、文件和文本的理解,支持原生函数调用。

一眼看

场地价值
型号IDglm-4-6v-flash
车型发布日期2025-12-08
输入模态文本、图片、视频、文件
输出模态正文
上下文窗口128K
重量精度-
最大输出令牌32,768
地区新加坡
特色视力、video_understanding、document_understanding、function_calling、structured_output、web_search
本土推断
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记免费
输出每100万个生成代币免费
隐式缓存读取每 1M 缓存输入标记免费
网页搜索启用时每个请求$0.033

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-4-6v-flash", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数1采样温度。较低的数值则更具确定性。GLM-4.7-闪存和GLM-4.6V闪存默认为1.0;GLM-4.5-闪存默认为0.6。·射程:0 – 1
top_p人数0.95核抽样概率质量。Z.AI 文档中,GLM-4.7、GLM-4.6 和 GLM-4.5 系列默认为 0.95。·范围:0.01 – 1
max_tokens人数4096GLM-4.6V闪存的最大输出令牌数:32768。·距离:1 – 32768
stop数组-停止词列表。Z.AI 目前支持数组形式的单点字符串。
do_sample布尔值确实如此启用采样。如果不确定,温度和top_p不会影响发电。
enable_thinking布尔值确实如此控制控制,Z.AI 思考模式。启用是默认设置;GLM-4.6V闪光灯会自动决定是否启用。
thinking对象-高级思维对象。请使用 {“type”:“enabled”} 或 {“type”:disabled“}。GLM-4.6V闪光灯会自动决定是否启用。
response_format对象-将 {“type”:“json_object} 设置为 JSON 模式,或将 {”type“:”text} 设置为纯文本。
tools数组-支持函数工具和内置web_search工具。
tool_choice枚举"auto"控制模型是否可以使用工具。Z.AI 文档自动工具选择;省略禁用工具使用。·允许:auto
tool_stream布尔值错误当流为真时,流函数调用工具输出。Z.AI 文档tool_stream GLM-4.6及更新型号。
tool_web_search布尔值错误启用内置的网页搜索功能。启用后每个请求会增加$0.033个请求。
search_result布尔值确实如此启用网页搜索时返回结构化的网页搜索结果元数据。
search_prompt-可选的总结检索网页搜索结果的说明。
count人数10需要检索的网络搜索结果数量。·范围:1 – 50
search_domain_filter-可选的域名白名单用于网页搜索结果。
search_recency_filter枚举"noLimit"可选的网络搜索窗口。·允许:oneDayoneWeekoneMonthoneYearnoLimit

注释

基础代币使用免费。内置网页搜索通过tool_web_search为可选功能,启用后每个请求添加$0.033。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/glm-4-6v-flash