Gemma 4 E4B | EmpirioLabs AI Docs

Google · Text Generation

POST /v1/chat/completions

Gemma 4 E4B es un modelo de chat multimodal abierto de Google con entrada de imágenes, llamada a funciones, salida estructurada y seguimiento eficiente de instrucciones.

A simple vista

Campo	Valor
ID de modelo	`gemma-4-e4b`
Fecha de lanzamiento del modelo	2026-03-31
Modalidades de entrada	Texto, Imagen
Modalidades de salida	Texto
Ventana de contexto	8K
Precisión del peso	AWQ 4-bit
Tokens de salida máximo	4,096
Características	visión, function_calling, structured_output, razonamiento
Inferencia nativa	Sí
Nuevo	No
Puntos finales soportados	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Precios

Carga	Especificaciones	Tarifa
Por mensaje	Fijado	$0.03
Búsqueda web (Linkup)	por llamada cuando se invoca	$0.013

Solicitud de ejemplo

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Parámetros

Parámetro	Tipo	Obligatorio	Default	Descripción
`temperature`	Número	no	`0.7`	Temperatura de muestreo. Los valores más bajos son más deterministas. · Rango: 0 – 2
`top_p`	Número	no	`0.95`	Masa de probabilidad de muestreo del núcleo. · Rango: 0 – 1
`min_p`	Número	no	`0`	Filtro de probabilidad mínima de token. · Rango: 0 – 1
`max_tokens`	enteros	no	`4096`	Tokens de salida máximos. · Rango: 1 – 4096
`stop`	Cuerda	no	-	Una o más cuerdas de registro.
`seed`	enteros	no	-	Semilla de muestreo determinista opcional. · Rango: 0 – 2147483647
`enable_thinking`	Booleano	no	Cierto	Activa el canal de razonamiento del modelo antes de la salida final.
`reasoning_effort`	enum	no	-	Pista compatible con OpenAI. Modo de pensamiento de habilitación media y alta. · Permitidos: `low`, `medium`, `high`
`presence_penalty`	Número	no	`0`	Penaliza fichas que ya aparecieron. · Rango: -2 – 2
`frequency_penalty`	Número	no	`0`	Penalizar los tokens repetidos por frecuencia. · Rango: -2 – 2
`repetition_penalty`	Número	no	`1`	Desanima a escribir exactamente lo que se repite. · Rango: 0,1 – 2
`logprobs`	Booleano	no	falso	Devuelve las probabilidades de registro de tokens cuando estén soportadas.
`top_logprobs`	enteros	no	-	Número de probabilidades de logarítmica alternativa de tokens para devolver. · Rango: 0 – 20
`tools`	Matriz	no	-	Definiciones de herramientas funcionales compatibles con OpenAI.
`tool_choice`	Objeto	no	-	Selección de herramientas funcionales compatibles con OpenAI.
`response_format`	Objeto	no	-	Instrucciones estructuradas de salida JSON.
`stream`	Booleano	no	falso	Deltas de respuesta al flujo usando eventos enviados por el servidor.
`web_search_linkup`	Booleano	no	falso	Búsqueda web opcional impulsada por Linkup. Cuando están habilitadas, las fuentes web recientes se recuperan usando tu último mensaje de usuario como consulta y se proporcionan al modelo como contexto adicional. Añade una $0.013 fija por petición además del coste normal del token del modelo. Desactivado por defecto.
`disable_formatting`	Booleano	no	falso	Cuando está habilitada, la pasarela no añadirá el pie de página “Fuentes” a las respuestas de los asistentes que utilizaron la búsqueda web de Linkup. Útil cuando la salida del modelo se transmite a otro sistema que no espera decoración.

Notas

Soporta entrada de texto e imágenes, streaming, herramientas funcionales, salida JSON estructurada, control semilla y modo de pensamiento activado por defecto. La facturación es por mensaje de éxito.

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.