Gemma 4 E4B

Gemma 4 E4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 E4B es un modelo de chat multimodal abierto de Google con entrada de imágenes, llamada a funciones, salida estructurada y seguimiento eficiente de instrucciones.

A simple vista

CampoValor
ID de modelogemma-4-e4b
Fecha de lanzamiento del modelo2026-03-31
Modalidades de entradaTexto, Imagen
Modalidades de salidaTexto
Ventana de contexto8K
Precisión del pesoAWQ 4-bit
Tokens de salida máximo4,096
Característicasvisión, function_calling, structured_output, razonamiento
Inferencia nativa
NuevoNo
Puntos finales soportadosPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Precios

CargaEspecificacionesTarifa
Por mensajeFijado$0.03
Búsqueda web (Linkup)por llamada cuando se invoca$0.013

Solicitud de ejemplo

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Parámetros

ParámetroTipoObligatorioDefaultDescripción
temperatureNúmerono0.7Temperatura de muestreo. Los valores más bajos son más deterministas. · Rango: 0 – 2
top_pNúmerono0.95Masa de probabilidad de muestreo del núcleo. · Rango: 0 – 1
min_pNúmerono0Filtro de probabilidad mínima de token. · Rango: 0 – 1
max_tokensenterosno4096Tokens de salida máximos. · Rango: 1 – 4096
stopCuerdano-Una o más cuerdas de registro.
seedenterosno-Semilla de muestreo determinista opcional. · Rango: 0 – 2147483647
enable_thinkingBooleanonoCiertoActiva el canal de razonamiento del modelo antes de la salida final.
reasoning_effortenumno-Pista compatible con OpenAI. Modo de pensamiento de habilitación media y alta. · Permitidos: low, medium, high
presence_penaltyNúmerono0Penaliza fichas que ya aparecieron. · Rango: -2 – 2
frequency_penaltyNúmerono0Penalizar los tokens repetidos por frecuencia. · Rango: -2 – 2
repetition_penaltyNúmerono1Desanima a escribir exactamente lo que se repite. · Rango: 0,1 – 2
logprobsBooleanonofalsoDevuelve las probabilidades de registro de tokens cuando estén soportadas.
top_logprobsenterosno-Número de probabilidades de logarítmica alternativa de tokens para devolver. · Rango: 0 – 20
toolsMatrizno-Definiciones de herramientas funcionales compatibles con OpenAI.
tool_choiceObjetono-Selección de herramientas funcionales compatibles con OpenAI.
response_formatObjetono-Instrucciones estructuradas de salida JSON.
streamBooleanonofalsoDeltas de respuesta al flujo usando eventos enviados por el servidor.
web_search_linkupBooleanonofalsoBúsqueda web opcional impulsada por Linkup. Cuando están habilitadas, las fuentes web recientes se recuperan usando tu último mensaje de usuario como consulta y se proporcionan al modelo como contexto adicional. Añade una $0.013 fija por petición además del coste normal del token del modelo. Desactivado por defecto.
disable_formattingBooleanonofalsoCuando está habilitada, la pasarela no añadirá el pie de página “Fuentes” a las respuestas de los asistentes que utilizaron la búsqueda web de Linkup. Útil cuando la salida del modelo se transmite a otro sistema que no espera decoración.

Notas

Soporta entrada de texto e imágenes, streaming, herramientas funcionales, salida JSON estructurada, control semilla y modo de pensamiento activado por defecto. La facturación es por mensaje de éxito.


Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.