Gemma 4 E4B

Gemma 4 E4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 E4B est un modèle de chat multimodal ouvert Google avec saisie d’images, appel de fonctions, sortie structurée et suivi efficace des instructions.

En un coup d’œil

TerrainValeur
Identifiant de modèlegemma-4-e4b
Date de sortie du modèle2026-03-31
Modalités d’entréeTexte, Image
Modalités de sortieTexte
Fenêtre de contexte8K
Précision du poidsAWQ 4 bits
Jetons de sortie max4,096
Caractéristiquesvision, function_calling, structured_output, raisonnement
Inférence autochtoneOui
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Par messagefixé$0.03
Recherche Web (Linkup)par appel lors de l’invocation$0.013

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. Les valeurs plus basses sont plus déterministes. · Plage: 0 – 2
top_pNombrenon0.95Probabilité d’échantillonnage du noyau, masse. · Répartition: 0 – 1
min_pNombrenon0Filtre de probabilité minimale des jetons. · Répartition: 0 – 1
max_tokensentiernon4096Jetons de sortie maximum. · Répartition: 1 – 4096
stopCordenon-Une ou plusieurs cordes de jeux.
seedentiernon-Seed d’échantillonnage déterministe optionnel. · Plage: 0 – 2147483647
enable_thinkingBooléennonVraiActivez le canal de raisonnement du modèle avant la sortie finale.
reasoning_effortenumnon-Indice compatible OpenAI. Mode de pensée moyen et haut. · Autorisé: low, medium, high
presence_penaltyNombrenon0Pénalisez les jetons déjà apparus. · Portée: -2 – 2
frequency_penaltyNombrenon0Pénaliser les jetons répétés par fréquence. · Portée: -2 – 2
repetition_penaltyNombrenon1Découragez les textes répétés exactement. · Plage: 0,1 – 2
logprobsBooléennonfauxRetournez les probabilités de log de jetons lorsqu’elles sont prises en charge.
top_logprobsentiernon-Nombre de probabilités logarithiques alternatives à revenir. · Plage: 0 – 20
toolsTableaunon-Définitions d’outils de fonctions compatibles OpenAI.
tool_choiceObjetnon-Sélection d’outils de fonctions compatibles OpenAI.
response_formatObjetnon-Instructions de sortie JSON structurées.
streamBooléennonfauxLes deltas de réponse du flux utilisent des événements envoyés par le serveur.
web_search_linkupBooléennonfauxRecherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
disable_formattingBooléennonfauxUne fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

Notes

Prend en charge la saisie de texte et d’images, le streaming, les outils de fonctions, la sortie JSON structurée, le contrôle de graines et le mode réflexion activé par défaut. La facturation dépend du message de réussite.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.