GLM 5.1 | EmpirioLabs AI Docs

Z.ai · Text Generation

/v1/chat/completions

202Kのコンテキスト、128Kの出力、ツール呼び出し、構造化出力、キャッシュサポートを備えた長コンテキストのZhipu AI推論モデル。

一目で

フィールド	価値
モデルID	`glm-5-1`
モデル発売日	2026-04-07
入力モダリティ	本文
出力モダリティ	本文
コンテキストウィンドウ	202K
重量精度	-
地域	中国
特徴	推論、function_calling、structured_output、キャッシュ
ネイティブ推論	いいえ
新作	はい
サポート端末	`/v1/chat/completions`、`/v1/responses`、`/v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	<=32K $0.825(は$1.40でした);32K-200K $1.10($1.40年)
出力	生成された1Mトークンあたり	<=32K $3.301(は$4.40でした);32K-200K $3.851($4.40年)
暗黙のキャッシュ読み取り	1Mのキャッシュ入力トークンごとに	<=32K $0.165(は$0.26でした);32K-200K $0.22($0.26年)
ウェブ検索(Linkup)	呼び出し時の通話ごと	$0.013

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "glm-5-1", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`max_tokens`	整数	いいえ	`4096`	生成できる最大出力トークン数。·範囲:1 – 128000
`temperature`	番号	いいえ	`1`	ランダム性を制御します。値が低いほど応答はより決定的になります。·射程:0 – 2
`top_p`	番号	いいえ	`0.95`	核サンプリングカットオフ。·射程:0 – 1
`top_k`	整数	いいえ	`20`	サンプリングは上位Kトークンに限定します。·範囲:1 – 100
`repetition_penalty`	番号	いいえ	`1`	繰り返しトークンを使った場合にペナルティを与えます。·射程:0.1 – 2
`reasoning_effort`	エヌム	いいえ	`"medium"`	推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:`none`、`low`、`medium`、`high`、`max`
`enable_thinking`	ブール値	いいえ	確かに	答える前にモデルに理屈を持たせてください。厳密な構造化出力のためにこれを無効にしてください。
`thinking_budget`	整数	いいえ	`32768`	思考時に思考するコンテンツの最大トークンが有効になっています。·射程:1 – 38912
`tool_stream`	ブール値	いいえ	偽り	ストリーム中に関数呼び出しの引数を段階的に行います。
`tools`	配列	いいえ	`[]`	OpenAI互換の関数呼び出しツール定義。
`tool_choice`	目的	いいえ	-	OpenAI互換のツール選択制御。
`parallel_tool_calls`	ブール値	いいえ	確かに	サポートされている場合、1ターンのアシスタントターンで複数のツールコールを許可してください。
`response_format`	目的	いいえ	-	OpenAI互換JSONモードまたはJSONスキーマ応答形式。厳密なスキーマにはノンシンキングモードを使いましょう。
`stop`	配列	いいえ	-	オプションの停止シーケンス。
`web_search_linkup`	ブール値	いいえ	偽り	Linkupによるオプションのウェブ検索機能。有効化すると、最新のウェブソースが最新のユーザーメッセージをクエリとして取得し、モデルに追加のコンテキストとして提供されます。モデルの通常のトークンコストに加えて、リクエストごとに定額$0.013が加算されます。デフォルトで無効化されています。
`disable_formatting`	ブール値	いいえ	偽り	有効化されると、Linkupウェブ検索を使用したアシスタント応答に「ソース」フッターを付け加えません。モデル出力が装飾を期待しない別のシステムに送られる場合に有用です。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/glm-5-1。