Gemma 4 E4B

Gemma 4 E4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 E4B 是一个Google开放的多模态聊天模型,具备图像输入、函数调用、结构化输出和高效的指令跟踪功能。

一眼看

场地价值
型号IDgemma-4-e4b
车型发布日期2026-03-31
输入模态文本,图片
输出模态正文
上下文窗口8K
重量精度AWQ 4位
最大输出令牌4,096
特色愿景、function_calling、structured_output、推理
本土推断是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
根据信息固定$0.03
网页搜索(Linkup)每次调用时$0.013

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度。较低的数值则更具确定性。·射程:0 – 2
top_p人数0.95核抽样概率质量。·射程:0 – 1
min_p人数0最小令牌概率过滤器。·射程:0 – 1
max_tokens整数4096最大输出令牌。·范围:1 – 4096
stop-一根或多根音栓。
seed整数-可选的确定性采样种子。·射程:0 – 2147483647
enable_thinking布尔值确实如此在最终输出前启用模型推理通道。
reasoning_effort枚举-兼容OpenAI的提示。中高开启思考模式。·允许:lowmediumhigh
presence_penalty人数0惩罚已经出现的代币。·射程:-2 – 2
frequency_penalty人数0按频率惩罚重复标记。·射程:-2 – 2
repetition_penalty人数1避免重复准确的文字。·射程:0.1 – 2
logprobs布尔值错误支持时返回令牌日志概率。
top_logprobs整数-备用令牌日志的回归概率数。·射程:0 – 20
tools数组-兼容 OpenAI 的函数工具定义。
tool_choice对象-兼容 OpenAI 的功能工具选择。
response_format对象-结构化JSON输出指令。
stream布尔值错误通过服务器发送的事件流式响应差异。
web_search_linkup布尔值错误可选的网页搜索由Linkup提供。启用后,最近的网页源会通过最新的用户消息作为查询检索,并作为额外上下文提供给模型。在模型正常的代币成本基础上,每个请求都增加了固定$0.013。默认为禁用。
disable_formatting布尔值错误启用后,网关不会在使用Linkup网页搜索的助理响应中附加“来源”脚部。当模型输出被传输到另一个不需要装饰的系统时,这很有用。

注释

默认支持文本和图片输入、流式传输、函数工具、结构化JSON输出、种子控制和思考模式。账单是按成功消息进行。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b