Gemma 4 E4B | EmpirioLabs AI Docs

Google · Text Generation

POST /v1/chat/completions

Gemma 4 E4B ist ein Google-Open-Multimodal-Chat-Modell mit Bildeingabe, Funktionsaufrufen, strukturierter Ausgabe und effizienter Befehlsfolge.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`gemma-4-e4b`
Modell-Veröffentlichungsdatum	2026-03-31
Eingabemodalitäten	Text, Bild
Ausgabemodalitäten	Text
Kontextfenster	8K
Gewichtspräzision	AWQ 4-Bit
Maximale Ausgabetoken	4,096
Merkmale	Vision, function_calling, structured_output, Denken
Native Schlussfolgerung	Ja
Neu	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Pro Nachricht	Behoben	$0.03
Websuche (Linkup)	pro Aufruf beim Aufruf	$0.013

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. Niedrigere Werte sind deterministischer. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.95`	Kernprobenwahrscheinlichkeitsmasse. · Reichweite: 0 – 1
`min_p`	Anzahl	Nein	`0`	Minimaler Token-Wahrscheinlichkeitsfilter. · Reichweite: 0 – 1
`max_tokens`	Ganzzahl	Nein	`4096`	Maximale Ausgabe-Token. · Reichweite: 1 – 4096
`stop`	String	Nein	-	Eine oder mehrere Register-Saiten.
`seed`	Ganzzahl	Nein	-	Optionales deterministisches Sampling-Saatgut. · Reichweite: 0 – 2147483647
`enable_thinking`	Boolean	Nein	Stimmt	Aktivieren Sie den Modell-Logikkanal vor der endgültigen Ausgabe.
`reasoning_effort`	ENUM	Nein	-	OpenAI-kompatibler Hinweis. Mittel und hoch ermöglichen den Denkmodus. · Erlaubt: `low`, `medium`, `high`
`presence_penalty`	Anzahl	Nein	`0`	Strafe Tokens, die bereits erschienen sind. · Reichweite: -2 – 2
`frequency_penalty`	Anzahl	Nein	`0`	Wiederholte Tokens nach Häufigkeit bestrafen. · Reichweite: -2 – 2
`repetition_penalty`	Anzahl	Nein	`1`	Entmutigen Sie exakte, wiederholte Texte. · Reichweite: 0,1 – 2
`logprobs`	Boolean	Nein	falsch	Geben Sie Token-Log-Wahrscheinlichkeiten zurück, wenn sie unterstützt werden.
`top_logprobs`	Ganzzahl	Nein	-	Anzahl der alternativen Token-Log-Wahrscheinlichkeiten, die zurückkehren. · Reichweite: 0 – 20
`tools`	Anordnung	Nein	-	OpenAI-kompatible Funktionswerkzeugdefinitionen.
`tool_choice`	Gegenstand	Nein	-	OpenAI-kompatible Funktionswerkzeugauswahl.
`response_format`	Gegenstand	Nein	-	Strukturierte JSON-Ausgabeanweisungen.
`stream`	Boolean	Nein	falsch	Stream-Antwort-Deltas mit servergesendeten Ereignissen.
`web_search_linkup`	Boolean	Nein	falsch	Optionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
`disable_formatting`	Boolean	Nein	falsch	Wenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Anmerkungen

Unterstützt Text- und Bildeingänge, Streaming, Funktionstools, strukturierte JSON-Ausgabe, Seed-Steuerung und standardmäßig aktivierten Denkmodus. Die Abrechnung erfolgt per erfolgreiche Nachricht.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b.