GLM 4.7 Flash

GLM 4.7 Flash
Z.ai · Text Generation
POST /v1/chat/completions

コーディング、推論、長い文脈作成、一般的なチャット用の無料の軽量GLM-4.7テキストモデル。

一目で

フィールド価値
モデルIDglm-4-7-flash
モデル発売日2026-01-19
入力モダリティ本文
出力モダリティ本文
コンテキストウィンドウ200K
重量精度-
最大出力トークン131,072
地域シンガポール
特徴理由、function_calling、structured_output、web_search
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり無料
出力生成された1Mトークンあたり無料
暗黙のキャッシュ読み取り1Mのキャッシュ入力トークンごとに無料
ウェブ検索有効時のリクエストごと$0.033

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-4-7-flash", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ1サンプリング温度。値が低いほど決定論的です。GLM-4.7-フラッシュおよびGLM-4.6V-フラッシュはデフォルトで1.0です。GLM-4.5-フラッシュはデフォルトで0.6です。·射程:0 – 1
top_p番号いいえ0.95原子核サンプリング確率質量。Z.AI ではGLM-4.7、GLM-4.6、GLM-4.5シリーズのデフォルトは0.95とされています。·範囲:0.01 – 1
max_tokens番号いいえ4096GLM-4.7-フラッシュの最大出力トークン数:131072。·射程:1 – 131072
stop配列いいえ-ストップワードリスト。Z.AI 現在、配列形式のワンストップ文字列をサポートしています。
do_sampleブール値いいえ確かにサンプリングを有効にしてください。誤りの場合、温度や発電top_pは影響しません。
enable_thinkingブール値いいえ確かに操作は思考モード Z.AI。Enabledがデフォルトで、GLM-4.7-Flashは思考します。単純な低遅延ターンには無効にしてください。
thinking目的いいえ-高度な思考対象。{“type”:“enabled”} または {“type”:disabled”} を使ってください。GLM-4.7-フラッシュは有効時の思考を行います。
response_format目的いいえ-JSONモードには{“type”:“json_object”}、プレーンテキストには{“type”:“text”}を設定します。
tools配列いいえ-機能ツールおよび組み込みのweb_searchツールもサポートしています。
tool_choiceエヌムいいえ"auto"モデルがツールを使うかどうかを制御します。Z.AI 文書自動ツール選択;ツールの使用を無効にするツールは省略してください。·許可:auto
tool_streamブール値いいえ偽りストリーム関数-ツールの出力は、ストリームが真である場合に行われます。Z.AI 文書はGLM-4.6以降のモデルtool_streamです。
tool_web_searchブール値いいえ偽り組み込みのウェブ検索を有効にしてください。有効化するとリクエストごとに$0.033個を追加します。
search_resultブール値いいえ確かにウェブ検索が有効の場合、構造化されたウェブ検索結果メタデータを返します。
search_promptストリングいいえ-取得したウェブ検索結果をまとめるためのオプションの指示があります。
count番号いいえ10検索結果の取得数。·範囲:1 – 50
search_domain_filterストリングいいえ-ウェブ検索結果にはオプションのドメインホワイトリスト。
search_recency_filterエヌムいいえ"noLimit"オプションでウェブ検索の最新ウィンドウもご利用いただけます。·許可:oneDayoneWeekoneMonthoneYearnoLimit

注記

基本トークンの使用は無料です。内蔵のウェブ検索はtool_web_searchを通じて任意で、有効化されるとリクエストごとに$0.033を追加します。


Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/glm-4-7-flash