GLM 4.7 Flash

Z.ai · Text Generation
POST /v1/chat/completions免费的轻量级GLM-4.7文本模型,用于编码、推理、长上下文写作和一般聊天。
一眼看
| 场地 | 价值 |
|---|---|
| 型号ID | glm-4-7-flash |
| 车型发布日期 | 2026-01-19 |
| 输入模态 | 正文 |
| 输出模态 | 正文 |
| 上下文窗口 | 20万公里 |
| 重量精度 | - |
| 最大输出令牌 | 131,072 |
| 地区 | 新加坡 |
| 特色 | 推理、function_calling、structured_output、web_search |
| 本土推断 | 不 |
| 新 | 是的 |
| 支持的端点 | POST /v1/chat/completions,POST /v1/responses,POST /v1/messages |
定价
| 冲锋 | 规格 | 速率 |
|---|---|---|
| 输入 | 每100万个提示词标记 | 免费 |
| 输出 | 每100万个生成代币 | 免费 |
| 隐式缓存读取 | 每 1M 缓存输入标记 | 免费 |
| 网页搜索 | 启用时每个请求 | $0.033 |
示例请求
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "glm-4-7-flash", "messages": [{"role":"user","content":"Hello"}]}'
参数
| 参数 | 类型 | 必修 | 默认 | 描述 |
|---|---|---|---|---|
temperature | 人数 | 不 | 1 | 采样温度。较低的数值则更具确定性。GLM-4.7-闪存和GLM-4.6V闪存默认为1.0;GLM-4.5-闪存默认为0.6。·射程:0 – 1 |
top_p | 人数 | 不 | 0.95 | 核抽样概率质量。Z.AI 文档中,GLM-4.7、GLM-4.6 和 GLM-4.5 系列默认为 0.95。·范围:0.01 – 1 |
max_tokens | 人数 | 不 | 4096 | GLM-4.7-闪存的最大输出令牌:131072。·射程:1 – 131072 |
stop | 数组 | 不 | - | 停止词列表。Z.AI 目前支持数组形式的单点字符串。 |
do_sample | 布尔值 | 不 | 确实如此 | 启用采样。如果不确定,温度和top_p不会影响发电。 |
enable_thinking | 布尔值 | 不 | 确实如此 | 控制控制,Z.AI 思考模式。启用是默认设置,使GLM-4.7-Flash思考;在简单的低延迟转弯时禁用它。 |
thinking | 对象 | 不 | - | 高级思维对象。请使用 {“type”:“enabled”} 或 {“type”:disabled“}。GLM-4.7-闪存在启用时会思考。 |
response_format | 对象 | 不 | - | 将 {“type”:“json_object} 设置为 JSON 模式,或将 {”type“:”text} 设置为纯文本。 |
tools | 数组 | 不 | - | 支持函数工具和内置web_search工具。 |
tool_choice | 枚举 | 不 | "auto" | 控制模型是否可以使用工具。Z.AI 文档自动工具选择;省略禁用工具使用。·允许:auto |
tool_stream | 布尔值 | 不 | 错误 | 当流为真时,流函数调用工具输出。Z.AI 文档tool_stream GLM-4.6及更新型号。 |
tool_web_search | 布尔值 | 不 | 错误 | 启用内置的网页搜索功能。启用后每个请求会增加$0.033个请求。 |
search_result | 布尔值 | 不 | 确实如此 | 启用网页搜索时返回结构化的网页搜索结果元数据。 |
search_prompt | 弦 | 不 | - | 可选的总结检索网页搜索结果的说明。 |
count | 人数 | 不 | 10 | 需要检索的网络搜索结果数量。·范围:1 – 50 |
search_domain_filter | 弦 | 不 | - | 可选的域名白名单用于网页搜索结果。 |
search_recency_filter | 枚举 | 不 | "noLimit" | 可选的网络搜索窗口。·允许:oneDay、oneWeek、oneMonth、oneYear、noLimit |
注释
基础代币使用免费。内置网页搜索通过tool_web_search为可选功能,启用后每个请求添加$0.033。
Machine可读模式: GET https://api.empiriolabs.ai/v1/models/glm-4-7-flash。
