Gemma 4 26B-A4B

Gemma 4 26B-A4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 26B A4B 是一款Google开放多模态模型,拥有 256K 上下文、文本、图像和视频输入、工具以及结构化输出。

一眼看

场地价值
型号IDgemma-4-26b-a4b
车型发布日期2026-03-31
输入模态文本、图像、视频
输出模态正文
上下文窗口256K
重量精度FP8权重 + FP8 KV
最大输出令牌32,768
特色推理、视觉、视频、function_calling、structured_output、缓存、多模态、json_mode、对数概率
本土推断是的
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messagesPOST /v1/completions

定价

冲锋规格速率
输入每100万个提示词标记$0.05(曾经$0.15)
输出每100万个生成代币$0.29(曾经$0.50)
隐式缓存读取每 1M 缓存输入标记$0.025(曾经$0.15)
网页搜索(Linkup)每次调用时$0.013

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-26b-a4b", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数1.0采样温度。较低的数值则更具确定性。·射程:0 – 2
top_p人数0.95核抽样概率质量。·射程:0 – 1
max_tokens整数4096最大输出令牌。·距离:1 – 32768
stop-一根或多根音栓。
reasoning_effort枚举"medium"推理努力。没有人能阻止思考;低、中、高和最高设定了有限的思维预算。·允许:nonelowmediumhighmax
enable_thinking布尔值确实如此在最终输出前启用模型推理通道。
thinking_budget整数4096在最终答案前使用最多思考代币。如果max_tokens较低,服务为答案保留空间。·距离:128 – 32768
top_k整数20支持时,限制抽样仅限于顶K候选代币。·范围:1 – 200
min_p人数0代币抽样的最小概率阈值。·射程:0 – 1
presence_penalty人数0对已出现在生成文本中的代币进行惩罚。·射程:-2 – 2
frequency_penalty人数0惩罚基于代币出现的频率。·射程:-2 – 2
repetition_penalty人数1SGLang 用于减少重复文本的惩罚。·射程:0.1 – 2
seed整数-可选的随机种子用于可复现抽样。·射程:0 – 2147483647
logprobs布尔值错误支持时返回令牌日志概率。
top_logprobs整数-返回最多这个数的顶级标记日志概率。·射程:0 – 20
logit_bias对象-通过在抽样前添加正值或负值来偏向令牌ID。
tools数组-兼容 OpenAI 的函数工具定义。
tool_choice对象-兼容 OpenAI 的功能工具选择。
response_format对象-结构化JSON输出指令。
stream布尔值错误通过服务器发送的事件流式响应差异。
web_search_linkup布尔值错误可选的网页搜索由Linkup提供。启用后,最近的网页源会通过最新的用户消息作为查询检索,并作为额外上下文提供给模型。在模型正常的代币成本基础上,每个请求都增加了固定$0.013。默认为禁用。
disable_formatting布尔值错误启用后,网关不会在使用Linkup网页搜索的助理响应中附加“来源”脚部。当模型输出被传输到另一个不需要装饰的系统时,这很有用。

注释

默认支持文本、图像和视频输入、流媒体、函数工具、结构化JSON输出、种子控制和思维模式。用reasoning_effort或thinking_budget表示有界思考,或者用enable_thinking=false表示直接答案。自动缓存读取按模型服务报告时的缓存输入速率计费。不支持显式缓存控制。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/gemma-4-26b-a4b