Gemma 4 E4B | EmpirioLabs AI Docs

Google · Text Generation

POST /v1/chat/completions

Gemma 4 E4B est un modèle de chat multimodal ouvert Google avec saisie d’images, appel de fonctions, sortie structurée et suivi efficace des instructions.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`gemma-4-e4b`
Date de sortie du modèle	2026-03-31
Modalités d’entrée	Texte, Image
Modalités de sortie	Texte
Fenêtre de contexte	8K
Précision du poids	AWQ 4 bits
Jetons de sortie max	4,096
Caractéristiques	vision, function_calling, structured_output, raisonnement
Inférence autochtone	Oui
Nouveau	Non
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Par message	fixé	$0.03
Recherche Web (Linkup)	par appel lors de l’invocation	$0.013

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. Les valeurs plus basses sont plus déterministes. · Plage: 0 – 2
`top_p`	Nombre	non	`0.95`	Probabilité d’échantillonnage du noyau, masse. · Répartition: 0 – 1
`min_p`	Nombre	non	`0`	Filtre de probabilité minimale des jetons. · Répartition: 0 – 1
`max_tokens`	entier	non	`4096`	Jetons de sortie maximum. · Répartition: 1 – 4096
`stop`	Corde	non	-	Une ou plusieurs cordes de jeux.
`seed`	entier	non	-	Seed d’échantillonnage déterministe optionnel. · Plage: 0 – 2147483647
`enable_thinking`	Booléen	non	Vrai	Activez le canal de raisonnement du modèle avant la sortie finale.
`reasoning_effort`	enum	non	-	Indice compatible OpenAI. Mode de pensée moyen et haut. · Autorisé: `low`, `medium`, `high`
`presence_penalty`	Nombre	non	`0`	Pénalisez les jetons déjà apparus. · Portée: -2 – 2
`frequency_penalty`	Nombre	non	`0`	Pénaliser les jetons répétés par fréquence. · Portée: -2 – 2
`repetition_penalty`	Nombre	non	`1`	Découragez les textes répétés exactement. · Plage: 0,1 – 2
`logprobs`	Booléen	non	faux	Retournez les probabilités de log de jetons lorsqu’elles sont prises en charge.
`top_logprobs`	entier	non	-	Nombre de probabilités logarithiques alternatives à revenir. · Plage: 0 – 20
`tools`	Tableau	non	-	Définitions d’outils de fonctions compatibles OpenAI.
`tool_choice`	Objet	non	-	Sélection d’outils de fonctions compatibles OpenAI.
`response_format`	Objet	non	-	Instructions de sortie JSON structurées.
`stream`	Booléen	non	faux	Les deltas de réponse du flux utilisent des événements envoyés par le serveur.
`web_search_linkup`	Booléen	non	faux	Recherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
`disable_formatting`	Booléen	non	faux	Une fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

Notes

Prend en charge la saisie de texte et d’images, le streaming, les outils de fonctions, la sortie JSON structurée, le contrôle de graines et le mode réflexion activé par défaut. La facturation dépend du message de réussite.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.