Gemma 4 E4B | EmpirioLabs AI Docs

Google · Text Generation

POST /v1/chat/completions

Gemma 4 E4B é um modelo de chat multimodal aberto do Google com entrada de imagens, chamada de funções, saída estruturada e acompanhamento eficiente de instruções.

De um olhar

Campo	Valor
ID do modelo	`gemma-4-e4b`
Data de lançamento do modelo	2026-03-31
Modalidades de entrada	Texto, Imagem
Modalidades de saída	Texto
Janela de contexto	8K
Precisão do peso	AWQ 4-bit
Tokens de saída máxima	4,096
Características	visão, function_calling, structured_output, raciocínio
Inferência nativa	Sim
Novo	Não
Endpoints suportados	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Precificação

Carga	Especificação	Taxa
Por Mensagem	fixo	$0.03
Busca na Web (Linkup)	por chamada quando invocada	$0.013

Exemplo de pedido

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Parâmetros

Parâmetro	Tipo	Obrigatório	Padrão	Descrição
`temperature`	Número	Não	`0.7`	Temperatura de amostragem. Valores mais baixos são mais determinísticos. · Intervalo: 0 – 2
`top_p`	Número	Não	`0.95`	Amostragem do núcleo com a probabilidade de massa. · Intervalo: 0 – 1
`min_p`	Número	Não	`0`	Filtro de probabilidade mínima de token. · Intervalo: 0 – 1
`max_tokens`	inteiro	Não	`4096`	Tokens de saída máximos. · Intervalo: 1 – 4096
`stop`	String	Não	-	Uma ou mais cordas de registro.
`seed`	inteiro	Não	-	Semente de amostragem determinística opcional. · Intervalo: 0 – 2147483647
`enable_thinking`	Booleano	Não	Verdade	Ative o canal de raciocínio do modelo antes da saída final.
`reasoning_effort`	enum	Não	-	Dica compatível com OpenAI. Modo de pensamento com habilitação média e alta. · Permitido: `low`, `medium`, `high`
`presence_penalty`	Número	Não	`0`	Penalize os tokens que já apareceram. · Alcance: -2 – 2
`frequency_penalty`	Número	Não	`0`	Penalize tokens repetidos pela frequência. · Alcance: -2 – 2
`repetition_penalty`	Número	Não	`1`	Desestimule mensagens repetidas exatamente. · Intervalo: 0,1 – 2
`logprobs`	Booleano	Não	falso	Devolva as probabilidades de logarista dos tokens quando suportado.
`top_logprobs`	inteiro	Não	-	Número de probabilidades de logaritarim alternativos de tokens para retornar. · Intervalo: 0 – 20
`tools`	Arranjo	Não	-	Definições de ferramentas funcionais compatíveis com OpenAI.
`tool_choice`	Objeto	Não	-	Seleção de ferramentas funcionais compatíveis com OpenAI.
`response_format`	Objeto	Não	-	Instruções de saída JSON estruturadas.
`stream`	Booleano	Não	falso	Deltas de resposta do fluxo usando eventos enviados pelo servidor.
`web_search_linkup`	Booleano	Não	falso	Busca opcional na web alimentada pelo Linkup. Quando ativadas, fontes web recentes são recuperadas usando sua última mensagem de usuário como consulta e fornecidas ao modelo como contexto adicional. Adiciona uma $0.013 fixa por requisição além do custo normal do token do modelo. Desativado por padrão.
`disable_formatting`	Booleano	Não	falso	Quando ativado, o gateway não adiciona o rodapé “Fontes” às respostas assistentes que usaram busca web do Linkup. Útil quando a saída do modelo é canalizada para outro sistema que não espera decoração.

Notas

Suporta entrada de texto e imagem, streaming, ferramentas funcionais, saída JSON estruturada, controle seed e modo de pensamento ativado por padrão. A cobrança é conforme a mensagem de sucesso.

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.