GLM 4.7 Flash

GLM 4.7 Flash
Z.ai · Text Generation
POST /v1/chat/completions

Kostenloses leichtes GLM-4.7-Textmodell für Codierung, Argumentation, Langkontext-Schreiben und allgemeinen Chat.

Auf einen Blick

SpielfeldWert
Modell-IDglm-4-7-flash
Modell-Veröffentlichungsdatum2026-01-19
EingabemodalitätenText
AusgabemodalitätenText
Kontextfenster200K
Gewichtspräzision-
Maximale Ausgabetoken131,072
RegionSingapur
MerkmaleArgumentation, function_calling, structured_output, web_search
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-TokenKostenlos
Ausgabepro 1 Million generierter TokenKostenlos
Implizite Cache-Leseartpro 1M zwischengespeicherten EingabetokenKostenlos
Websuchepro Anfrage, wenn aktiviert$0.033

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-4-7-flash", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein1Temperatur wird geprochen. Niedrigere Werte sind deterministischer. GLM-4.7-Flash und GLM-4.6V-Flash sind standardmäßig auf 1.0 eingestellt; GLM-4.5-Flash steht standardmäßig auf 0,6. · Reichweite: 0 – 1
top_pAnzahlNein0.95Kernprobenwahrscheinlichkeitsmasse. Z.AI dokumentiert einen Standard von 0,95 für die GLM-4.7-, GLM-4.6- und GLM-4.5-Serien. · Reichweite: 0,01 – 1
max_tokensAnzahlNein4096Maximale Ausgabetoken für GLM-4.7-Flash: 131072. · Reichweite: 1 – 131072
stopAnordnungNein-Hör auf mit der Wortliste. Z.AI unterstützt derzeit eine Ein-Stopp-String in Array-Form.
do_sampleBooleanNeinStimmtAktivieren Sie das Sampling. Wenn falsch, beeinflussen Temperatur und top_p die Erzeugung nicht.
enable_thinkingBooleanNeinStimmtKontrolliert Z.AI Denkmodus. Aktiviert ist der Standard und lässt GLM-4.7-Flash denken; Deaktiviere es für einfache, latenzarme Drehungen.
thinkingGegenstandNein-Fortschrittliches Denkobjekt. Verwenden Sie {“type”:“enabled”} oder {“type”:“disabled”}. GLM-4.7-Flash denkt, wenn es aktiviert ist.
response_formatGegenstandNein-Setze {“type”:“json_object”} für den JSON-Modus oder {“type”:“text”} für Klartext.
toolsAnordnungNein-Funktionswerkzeuge und das integrierte web_search-Tool werden unterstützt.
tool_choiceENUMNein"auto"Kontrolliert, ob das Modell Werkzeuge verwenden darf. Z.AI Dokumente automatische Werkzeugauswahl; Weglassen Sie Werkzeuge, um die Werkzeugnutzung zu deaktivieren. · Erlaubt: auto
tool_streamBooleanNeinfalschDas Stream-Funktionsaufruf-Tool gibt aus, wenn der Stream true ist. Z.AI Dokumente tool_stream für GLM-4.6 und neuere Modelle.
tool_web_searchBooleanNeinfalschAktivieren Sie die integrierte Websuche. Fügt $0.033 pro Anfrage hinzu, wenn sie aktiviert ist.
search_resultBooleanNeinStimmtGeben Sie strukturierte Websuchergebnismetadaten zurück, wenn die Websuche aktiviert ist.
search_promptStringNein-Optionale Anleitung zur Zusammenfassung der abgerufenen Websuchergebnisse.
countAnzahlNein10Anzahl der zu abrufenden Websuchergebnisse. · Reichweite: 1 – 50
search_domain_filterStringNein-Optionale Domain-Whitelist für Websuchergebnisse.
search_recency_filterENUMNein"noLimit"Optionales Aktualisierungsfenster für Websuche. · Erlaubt: oneDay, oneWeek, oneMonth, oneYear, noLimit

Anmerkungen

Die Nutzung des Basistokens ist kostenlos. Die integrierte Websuche ist über tool_web_search optional und fügt $0.033 pro Anfrage hinzu, wenn sie aktiviert ist.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/glm-4-7-flash.