Gemma 4 E4B

Google · Text Generation

POST /v1/chat/completions

Gemma 4 E4B 是一个Google开放的多模态聊天模型，具备图像输入、函数调用、结构化输出和高效的指令跟踪功能。

一眼看

场地	价值
型号ID	`gemma-4-e4b`
车型发布日期	2026-03-31
输入模态	文本，图片
输出模态	正文
上下文窗口	8K
重量精度	AWQ 4位
最大输出令牌	4,096
特色	愿景、function_calling、structured_output、推理
本土推断	是的
新	不
支持的端点	`POST /v1/chat/completions`，`POST /v1/responses`，`POST /v1/messages`

定价

冲锋	规格	速率
根据信息	固定	$0.03
网页搜索（Linkup）	每次调用时	$0.013

示例请求

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数	类型	必修	默认	描述
`temperature`	人数	不	`0.7`	采样温度。较低的数值则更具确定性。·射程：0 – 2
`top_p`	人数	不	`0.95`	核抽样概率质量。·射程：0 – 1
`min_p`	人数	不	`0`	最小令牌概率过滤器。·射程：0 – 1
`max_tokens`	整数	不	`4096`	最大输出令牌。·范围：1 – 4096
`stop`	弦	不	-	一根或多根音栓。
`seed`	整数	不	-	可选的确定性采样种子。·射程：0 – 2147483647
`enable_thinking`	布尔值	不	确实如此	在最终输出前启用模型推理通道。
`reasoning_effort`	枚举	不	-	兼容OpenAI的提示。中高开启思考模式。·允许：`low`，`medium`，`high`
`presence_penalty`	人数	不	`0`	惩罚已经出现的代币。·射程：-2 – 2
`frequency_penalty`	人数	不	`0`	按频率惩罚重复标记。·射程：-2 – 2
`repetition_penalty`	人数	不	`1`	避免重复准确的文字。·射程：0.1 – 2
`logprobs`	布尔值	不	错误	支持时返回令牌日志概率。
`top_logprobs`	整数	不	-	备用令牌日志的回归概率数。·射程：0 – 20
`tools`	数组	不	-	兼容 OpenAI 的函数工具定义。
`tool_choice`	对象	不	-	兼容 OpenAI 的功能工具选择。
`response_format`	对象	不	-	结构化JSON输出指令。
`stream`	布尔值	不	错误	通过服务器发送的事件流式响应差异。
`web_search_linkup`	布尔值	不	错误	可选的网页搜索由Linkup提供。启用后，最近的网页源会通过最新的用户消息作为查询检索，并作为额外上下文提供给模型。在模型正常的代币成本基础上，每个请求都增加了固定$0.013。默认为禁用。
`disable_formatting`	布尔值	不	错误	启用后，网关不会在使用Linkup网页搜索的助理响应中附加“来源”脚部。当模型输出被传输到另一个不需要装饰的系统时，这很有用。

注释

默认支持文本和图片输入、流式传输、函数工具、结构化JSON输出、种子控制和思考模式。账单是按成功消息进行。

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b。