Gemma 4 E4B

Gemma 4 E4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 E4B é um modelo de chat multimodal aberto do Google com entrada de imagens, chamada de funções, saída estruturada e acompanhamento eficiente de instruções.

De um olhar

CampoValor
ID do modelogemma-4-e4b
Data de lançamento do modelo2026-03-31
Modalidades de entradaTexto, Imagem
Modalidades de saídaTexto
Janela de contexto8K
Precisão do pesoAWQ 4-bit
Tokens de saída máxima4,096
Característicasvisão, function_calling, structured_output, raciocínio
Inferência nativaSim
NovoNão
Endpoints suportadosPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Precificação

CargaEspecificaçãoTaxa
Por Mensagemfixo$0.03
Busca na Web (Linkup)por chamada quando invocada$0.013

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
temperatureNúmeroNão0.7Temperatura de amostragem. Valores mais baixos são mais determinísticos. · Intervalo: 0 – 2
top_pNúmeroNão0.95Amostragem do núcleo com a probabilidade de massa. · Intervalo: 0 – 1
min_pNúmeroNão0Filtro de probabilidade mínima de token. · Intervalo: 0 – 1
max_tokensinteiroNão4096Tokens de saída máximos. · Intervalo: 1 – 4096
stopStringNão-Uma ou mais cordas de registro.
seedinteiroNão-Semente de amostragem determinística opcional. · Intervalo: 0 – 2147483647
enable_thinkingBooleanoNãoVerdadeAtive o canal de raciocínio do modelo antes da saída final.
reasoning_effortenumNão-Dica compatível com OpenAI. Modo de pensamento com habilitação média e alta. · Permitido: low, medium, high
presence_penaltyNúmeroNão0Penalize os tokens que já apareceram. · Alcance: -2 – 2
frequency_penaltyNúmeroNão0Penalize tokens repetidos pela frequência. · Alcance: -2 – 2
repetition_penaltyNúmeroNão1Desestimule mensagens repetidas exatamente. · Intervalo: 0,1 – 2
logprobsBooleanoNãofalsoDevolva as probabilidades de logarista dos tokens quando suportado.
top_logprobsinteiroNão-Número de probabilidades de logaritarim alternativos de tokens para retornar. · Intervalo: 0 – 20
toolsArranjoNão-Definições de ferramentas funcionais compatíveis com OpenAI.
tool_choiceObjetoNão-Seleção de ferramentas funcionais compatíveis com OpenAI.
response_formatObjetoNão-Instruções de saída JSON estruturadas.
streamBooleanoNãofalsoDeltas de resposta do fluxo usando eventos enviados pelo servidor.
web_search_linkupBooleanoNãofalsoBusca opcional na web alimentada pelo Linkup. Quando ativadas, fontes web recentes são recuperadas usando sua última mensagem de usuário como consulta e fornecidas ao modelo como contexto adicional. Adiciona uma $0.013 fixa por requisição além do custo normal do token do modelo. Desativado por padrão.
disable_formattingBooleanoNãofalsoQuando ativado, o gateway não adiciona o rodapé “Fontes” às respostas assistentes que usaram busca web do Linkup. Útil quando a saída do modelo é canalizada para outro sistema que não espera decoração.

Notas

Suporta entrada de texto e imagem, streaming, ferramentas funcionais, saída JSON estruturada, controle seed e modo de pensamento ativado por padrão. A cobrança é conforme a mensagem de sucesso.


Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.