Gemma 4 E4B

Gemma 4 E4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 E4B ist ein Google-Open-Multimodal-Chat-Modell mit Bildeingabe, Funktionsaufrufen, strukturierter Ausgabe und effizienter Befehlsfolge.

Auf einen Blick

SpielfeldWert
Modell-IDgemma-4-e4b
Modell-Veröffentlichungsdatum2026-03-31
EingabemodalitätenText, Bild
AusgabemodalitätenText
Kontextfenster8K
GewichtspräzisionAWQ 4-Bit
Maximale Ausgabetoken4,096
MerkmaleVision, function_calling, structured_output, Denken
Native SchlussfolgerungJa
NeuNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Pro NachrichtBehoben$0.03
Websuche (Linkup)pro Aufruf beim Aufruf$0.013

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. Niedrigere Werte sind deterministischer. · Reichweite: 0 – 2
top_pAnzahlNein0.95Kernprobenwahrscheinlichkeitsmasse. · Reichweite: 0 – 1
min_pAnzahlNein0Minimaler Token-Wahrscheinlichkeitsfilter. · Reichweite: 0 – 1
max_tokensGanzzahlNein4096Maximale Ausgabe-Token. · Reichweite: 1 – 4096
stopStringNein-Eine oder mehrere Register-Saiten.
seedGanzzahlNein-Optionales deterministisches Sampling-Saatgut. · Reichweite: 0 – 2147483647
enable_thinkingBooleanNeinStimmtAktivieren Sie den Modell-Logikkanal vor der endgültigen Ausgabe.
reasoning_effortENUMNein-OpenAI-kompatibler Hinweis. Mittel und hoch ermöglichen den Denkmodus. · Erlaubt: low, medium, high
presence_penaltyAnzahlNein0Strafe Tokens, die bereits erschienen sind. · Reichweite: -2 – 2
frequency_penaltyAnzahlNein0Wiederholte Tokens nach Häufigkeit bestrafen. · Reichweite: -2 – 2
repetition_penaltyAnzahlNein1Entmutigen Sie exakte, wiederholte Texte. · Reichweite: 0,1 – 2
logprobsBooleanNeinfalschGeben Sie Token-Log-Wahrscheinlichkeiten zurück, wenn sie unterstützt werden.
top_logprobsGanzzahlNein-Anzahl der alternativen Token-Log-Wahrscheinlichkeiten, die zurückkehren. · Reichweite: 0 – 20
toolsAnordnungNein-OpenAI-kompatible Funktionswerkzeugdefinitionen.
tool_choiceGegenstandNein-OpenAI-kompatible Funktionswerkzeugauswahl.
response_formatGegenstandNein-Strukturierte JSON-Ausgabeanweisungen.
streamBooleanNeinfalschStream-Antwort-Deltas mit servergesendeten Ereignissen.
web_search_linkupBooleanNeinfalschOptionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
disable_formattingBooleanNeinfalschWenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Anmerkungen

Unterstützt Text- und Bildeingänge, Streaming, Funktionstools, strukturierte JSON-Ausgabe, Seed-Steuerung und standardmäßig aktivierten Denkmodus. Die Abrechnung erfolgt per erfolgreiche Nachricht.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.