GLM 4.5 Flash

Z.ai · Text Generation
POST /v1/chat/completionsKostenloses leichtes GLM-4.5-Textmodell für Argumentation, Codierung, Langform-Chat und allgemeine Sprachaufgaben.
Auf einen Blick
| Spielfeld | Wert |
|---|---|
| Modell-ID | glm-4-5-flash |
| Modell-Veröffentlichungsdatum | 2025-07-28 |
| Eingabemodalitäten | Text |
| Ausgabemodalitäten | Text |
| Kontextfenster | 200K |
| Gewichtspräzision | - |
| Maximale Ausgabetoken | 98,304 |
| Region | Singapur |
| Merkmale | Argumentation, function_calling, structured_output, web_search |
| Native Schlussfolgerung | Nein |
| Neu | Ja |
| Unterstützte Endpunkte | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Preisgestaltung
| Berechnen | Spezifikation | Zinssatz |
|---|---|---|
| Eingabe | pro 1M Prompt-Token | Kostenlos |
| Ausgabe | pro 1 Million generierter Token | Kostenlos |
| Implizite Cache-Leseart | pro 1M zwischengespeicherten Eingabetoken | Kostenlos |
| Websuche | pro Anfrage, wenn aktiviert | $0.033 |
Beispielanfrage
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "glm-4-5-flash", "messages": [{"role":"user","content":"Hello"}]}'
Parameter
| Parameter | Typ | Erforderlich | Default | Beschreibung |
|---|---|---|---|---|
temperature | Anzahl | Nein | 0.6 | Temperatur wird geprochen. Niedrigere Werte sind deterministischer. GLM-4.7-Flash und GLM-4.6V-Flash sind standardmäßig auf 1.0 eingestellt; GLM-4.5-Flash steht standardmäßig auf 0,6. · Reichweite: 0 – 1 |
top_p | Anzahl | Nein | 0.95 | Kernprobenwahrscheinlichkeitsmasse. Z.AI dokumentiert einen Standard von 0,95 für die GLM-4.7-, GLM-4.6- und GLM-4.5-Serien. · Reichweite: 0,01 – 1 |
max_tokens | Anzahl | Nein | 4096 | Maximale Ausgabetoken für GLM-4.5-Flash: 98304. · Reichweite: 1 – 98304 |
stop | Anordnung | Nein | - | Hör auf mit der Wortliste. Z.AI unterstützt derzeit eine Ein-Stopp-String in Array-Form. |
do_sample | Boolean | Nein | Stimmt | Aktivieren Sie das Sampling. Wenn falsch, beeinflussen Temperatur und top_p die Erzeugung nicht. |
enable_thinking | Boolean | Nein | Stimmt | Kontrolliert Z.AI Denkmodus. Aktiviert ist der Standard; GLM-4.5-Flash entscheidet automatisch, ob es denkt, wenn es aktiviert ist. |
thinking | Gegenstand | Nein | - | Fortschrittliches Denkobjekt. Verwenden Sie {“type”:“enabled”} oder {“type”:“disabled”}. GLM-4.5-Flash entscheidet automatisch, ob es denkt, wenn es aktiviert ist. |
response_format | Gegenstand | Nein | - | Setze {“type”:“json_object”} für den JSON-Modus oder {“type”:“text”} für Klartext. |
tools | Anordnung | Nein | - | Funktionswerkzeuge und das integrierte web_search-Tool werden unterstützt. |
tool_choice | ENUM | Nein | "auto" | Kontrolliert, ob das Modell Werkzeuge verwenden darf. Z.AI Dokumente automatische Werkzeugauswahl; Weglassen Sie Werkzeuge, um die Werkzeugnutzung zu deaktivieren. · Erlaubt: auto |
tool_web_search | Boolean | Nein | falsch | Aktivieren Sie die integrierte Websuche. Fügt $0.033 pro Anfrage hinzu, wenn sie aktiviert ist. |
search_result | Boolean | Nein | Stimmt | Geben Sie strukturierte Websuchergebnismetadaten zurück, wenn die Websuche aktiviert ist. |
search_prompt | String | Nein | - | Optionale Anleitung zur Zusammenfassung der abgerufenen Websuchergebnisse. |
count | Anzahl | Nein | 10 | Anzahl der zu abrufenden Websuchergebnisse. · Reichweite: 1 – 50 |
search_domain_filter | String | Nein | - | Optionale Domain-Whitelist für Websuchergebnisse. |
search_recency_filter | ENUM | Nein | "noLimit" | Optionales Aktualisierungsfenster für Websuche. · Erlaubt: oneDay, oneWeek, oneMonth, oneYear, noLimit |
Anmerkungen
Die Nutzung des Basistokens ist kostenlos. Die integrierte Websuche ist über tool_web_search optional und fügt $0.033 pro Anfrage hinzu, wenn sie aktiviert ist.
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/glm-4-5-flash.
