GLM 5.2

GLM 5.2
Z.ai · Text Generation
/v1/chat/completions

1Mトークンコンテキスト、128Kの出力、調整可能な推論努力、ネイティブのウェブ検索、ツール呼び出しを備えた推論・コーディングモデル。

一目で

フィールド価値
モデルIDglm-5-2
モデル発売日2026-06-16
入力モダリティ本文
出力モダリティ本文
コンテキストウィンドウ1M
重量精度-
最大出力トークン131,072
地域シンガポール
特徴理由、function_calling、structured_output、web_search
ネイティブ推論いいえ
新作はい
サポート端末/v1/chat/completions/v1/responses/v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$1.40
出力生成された1Mトークンあたり$4.40
ウェブ検索リクエストごとに$0.033

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-5-2", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
max_tokens整数いいえ65536生成できる最大出力トークン数。·射程:1 – 131072
temperature番号いいえ1ランダム性を制御します。値が低いほど応答はより決定的になります。·射程:0 – 1
top_p番号いいえ0.95核サンプリングカットオフ。·範囲:0.01 – 1
reasoning_effortエヌムいいえ"max"GLM-5.2の推論努力。誰も思考を妨げるものではない。最小から最大まで、モデルがどれだけ推理をしているかを決めてから答えます。複雑なコーディングにはMaxが推奨されます。·許可:noneminimallowmediumhighxhighmax
enable_thinkingブール値いいえ確かに答える前にモデルに理屈を持たせてください。最も遅延の少ない返信や厳格な構造化出力のために電源を切ってください。
do_sampleブール値いいえ確かにサンプリングを有効にしてください。貪欲な決定論的出力(温度とtop_pは無視)には電源を切ってください。
tool_web_searchブール値いいえ偽り組み込みのウェブ検索を有効にしてください。使用時にリクエストごとに$0.033個を追加します。
search_recency_filterエヌムいいえ"noLimit"ウェブ検索結果は最近のウィンドウに限定しましょう。·許可:oneDayoneWeekoneMonthoneYearnoLimit
count整数いいえ10ウェブ検索が有効になっているときに取得できる検索結果の数。·範囲:1 – 50
search_domain_filterストリングいいえ-ウェブ検索を特定のドメインに限定しましょう。
search_promptストリングいいえ-取得したウェブ検索結果を要約するためのオプションプロンプト。
search_resultブール値いいえ確かにウェブ検索が有効になった場合、レスポンスでウェブ検索結果のメタデータを返してください。
tool_streamブール値いいえ偽りストリーム中に関数呼び出しの引数を段階的に行います。
tools配列いいえ[]OpenAI互換の関数呼び出しツール定義。
tool_choice目的いいえ-OpenAI互換のツール選択制御。
response_format目的いいえ-OpenAI互換JSONモード。厳格な構造化出力には思考障害を使いましょう。
stop配列いいえ-オプションで最大4回までのストップシーケンスがあります。

バリエーション

:variant1

フィールド価値
モデルIDglm-5-2:variant1
モデル発売日2026-06-16
地域ドイツ
コンテキストウィンドウ1M
重量精度-
最大出力トークン131,072
特徴推論、function_calling、structured_output、キャッシュ
ネイティブ推論いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$1.10(だった$1.40)
出力生成された1Mトークンあたり$3.851(だった$4.40)
暗黙のキャッシュ読み取り1Mのキャッシュ入力トークンごとに$0.275

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0 = 決定論的、2 = 最大ランダム性。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。低い方が = より集中しています。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 131072
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に、step-by-step理由をつけておきましょう。
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
thinking_budget番号いいえ32768推論プロセスのために最大トークンが予約されています。131072まで。·射程:1 – 131072

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/glm-5-2