GLM 4.7 Flash | EmpirioLabs AI Docs

Z.ai · Text Generation

POST /v1/chat/completions

Kostenloses leichtes GLM-4.7-Textmodell für Codierung, Argumentation, Langkontext-Schreiben und allgemeinen Chat.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`glm-4-7-flash`
Modell-Veröffentlichungsdatum	2026-01-19
Eingabemodalitäten	Text
Ausgabemodalitäten	Text
Kontextfenster	200K
Gewichtspräzision	-
Maximale Ausgabetoken	131,072
Region	Singapur
Merkmale	Argumentation, function_calling, structured_output, web_search
Native Schlussfolgerung	Nein
Neu	Ja
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	Kostenlos
Ausgabe	pro 1 Million generierter Token	Kostenlos
Implizite Cache-Leseart	pro 1M zwischengespeicherten Eingabetoken	Kostenlos
Websuche	pro Anfrage, wenn aktiviert	$0.033

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "glm-4-7-flash", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`1`	Temperatur wird geprochen. Niedrigere Werte sind deterministischer. GLM-4.7-Flash und GLM-4.6V-Flash sind standardmäßig auf 1.0 eingestellt; GLM-4.5-Flash steht standardmäßig auf 0,6. · Reichweite: 0 – 1
`top_p`	Anzahl	Nein	`0.95`	Kernprobenwahrscheinlichkeitsmasse. Z.AI dokumentiert einen Standard von 0,95 für die GLM-4.7-, GLM-4.6- und GLM-4.5-Serien. · Reichweite: 0,01 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Ausgabetoken für GLM-4.7-Flash: 131072. · Reichweite: 1 – 131072
`stop`	Anordnung	Nein	-	Hör auf mit der Wortliste. Z.AI unterstützt derzeit eine Ein-Stopp-String in Array-Form.
`do_sample`	Boolean	Nein	Stimmt	Aktivieren Sie das Sampling. Wenn falsch, beeinflussen Temperatur und top_p die Erzeugung nicht.
`enable_thinking`	Boolean	Nein	Stimmt	Kontrolliert Z.AI Denkmodus. Aktiviert ist der Standard und lässt GLM-4.7-Flash denken; Deaktiviere es für einfache, latenzarme Drehungen.
`thinking`	Gegenstand	Nein	-	Fortschrittliches Denkobjekt. Verwenden Sie {“type”:“enabled”} oder {“type”:“disabled”}. GLM-4.7-Flash denkt, wenn es aktiviert ist.
`response_format`	Gegenstand	Nein	-	Setze {“type”:“json_object”} für den JSON-Modus oder {“type”:“text”} für Klartext.
`tools`	Anordnung	Nein	-	Funktionswerkzeuge und das integrierte web_search-Tool werden unterstützt.
`tool_choice`	ENUM	Nein	`"auto"`	Kontrolliert, ob das Modell Werkzeuge verwenden darf. Z.AI Dokumente automatische Werkzeugauswahl; Weglassen Sie Werkzeuge, um die Werkzeugnutzung zu deaktivieren. · Erlaubt: `auto`
`tool_stream`	Boolean	Nein	falsch	Das Stream-Funktionsaufruf-Tool gibt aus, wenn der Stream true ist. Z.AI Dokumente tool_stream für GLM-4.6 und neuere Modelle.
`tool_web_search`	Boolean	Nein	falsch	Aktivieren Sie die integrierte Websuche. Fügt $0.033 pro Anfrage hinzu, wenn sie aktiviert ist.
`search_result`	Boolean	Nein	Stimmt	Geben Sie strukturierte Websuchergebnismetadaten zurück, wenn die Websuche aktiviert ist.
`search_prompt`	String	Nein	-	Optionale Anleitung zur Zusammenfassung der abgerufenen Websuchergebnisse.
`count`	Anzahl	Nein	`10`	Anzahl der zu abrufenden Websuchergebnisse. · Reichweite: 1 – 50
`search_domain_filter`	String	Nein	-	Optionale Domain-Whitelist für Websuchergebnisse.
`search_recency_filter`	ENUM	Nein	`"noLimit"`	Optionales Aktualisierungsfenster für Websuche. · Erlaubt: `oneDay`, `oneWeek`, `oneMonth`, `oneYear`, `noLimit`

Anmerkungen

Die Nutzung des Basistokens ist kostenlos. Die integrierte Websuche ist über tool_web_search optional und fügt $0.033 pro Anfrage hinzu, wenn sie aktiviert ist.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/glm-4-7-flash.