GLM 5.2 | EmpirioLabs AI Docs

Z.ai · Text Generation

/v1/chat/completions

Reasoning and coding model with a 1M token context, 128K output, adjustedable reasoning effort, native web search, and tool calling.

في لمحة

الميدان	القيمة
النموذج	`glm-5-2`
تاريخ الإفراج النموذجي	2026-06-16
طرائق المدخلات	النص
طرائق النواتج	النص
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	131,072
المنطقة	سنغافورة
المعالم	التعليل، الوظيفة - التصاميم، النواتج المنظمة، البحث الشبكي
Native inference	لا
جديدة	نعم
نقاط النهاية المدعومة	`/v1/chat/completions`, `/v1/responses`, `/v1/messages`

الطباعة

الرسم	Spec	المعدل
الناتج	1M	$1.40
الناتج	1M المولدة	$4.40
Web search	لكل طلب	$0.033

طلب مثال

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "glm-5-2", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامترات	النوع	المطلوبة	التقصير	الوصف
`max_tokens`	integer	لا	`65536`	أكبر عدد من مكامن الإنتاج لتوليدها. الرنج: 1-131072
`temperature`	العدد	لا	`1`	تحكم عشوائي فالقيم الدنيا تجعل الاستجابات أكثر تحديدا. الرنج: صفر - 1
`top_p`	العدد	لا	`0.95`	(ناكليوس) يقطع العينات الرنج: 0.01 - 1
`reasoning_effort`	enum	لا	`"max"`	جهد استدلالي GLM-5.2. لا أحد يعيق التفكير؛ الحد الأدنى حتى الحد الأقصى حدد مدى صعوبة النموذج قبل الإجابة. يوصى ب MAX للبرمجة المعقدة. · مسموح: `none`، `minimal`، `low`، `medium`، `high`، `xhigh`، `max`
`enable_thinking`	boolean	لا	صحيح	إسمح للنموذج بالعقل قبل الإجابة أطفأ لأدنى الردود أو للناتج المنظم الصارم.
`do_sample`	boolean	لا	صحيح	أخذ عينات اتجهوا نحو الناتج المحدد الجشع (تم تجاهل التمرينات والأعلى).
`tool_web_search`	boolean	لا	كاذب	فعل البحث المدمج على الويب. يضيف $0.033 لكل طلب عند استخدامه.
`search_recency_filter`	enum	لا	`"noLimit"`	حدد نتائج البحث على الويب في نافذة حديثة. · مسموح ب: `oneDay`، `oneWeek`، `oneMonth`، `oneYear`، `noLimit`
`count`	integer	لا	`10`	Number of web search results to retrieve when web search is enabled. الرنج: 1 - 50
`search_domain_filter`	سلسلة	لا	-	تقييد البحث على شبكة الإنترنت إلى مجال محدد.
`search_prompt`	سلسلة	لا	-	وسرعتها الاختيارية تستخدم لتلخيص نتائج البحث على الشبكة.
`search_result`	boolean	لا	صحيح	Re web search result metadata in the response when web search is enabled.
`tool_stream`	boolean	لا	كاذب	تجمّع الحجج عن العمل بشكل تدريجي عندما تتدفق
`tools`	صفائف	لا	`[]`	OpenAI-compatible function calling tool definitions.
`tool_choice`	الجسم	لا	-	التحكم في اختيار الأدوات المتوافقة
`response_format`	الجسم	لا	-	أسلوب (الجوسون) المفتوح استخدام التفكير المعاق للحصول على ناتج منظم صارم.
`stop`	صفائف	لا	-	التوقيف الاختياري (حتى 4).

المتغيرات

`:variant1`

الميدان	القيمة
النموذج	`glm-5-2:variant1`
تاريخ الإفراج النموذجي	2026-06-16
المنطقة	ألمانيا
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	131,072
المعالم	التعليل، الوظيفة
Native inference	لا
نقاط النهاية المدعومة	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

** تسعير**

الرسم	Spec	المعدل
الناتج	1M	$1.10 (كان $1.40)
الناتج	1M المولدة	$3.851 (كان $4.40)
يُقرأ المخبأ	1M cached input tokens	$0.275

** بارامترات**

البارامترات	النوع	المطلوبة	التقصير	الوصف
`temperature`	العدد	لا	`0.7`	درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
`top_p`	العدد	لا	`0.9`	نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
`max_tokens`	العدد	لا	`4096`	الحد الأقصى للناتج الرنج: 1-131072
`stop`	سلسلة	لا	-	حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
`enable_thinking`	boolean	لا	صحيح	فعل step-by-step المنطق قبل الإجابة.
`reasoning_effort`	enum	لا	`"medium"`	مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: `none`، `low`، `medium`، `high`، `max`
`thinking_budget`	العدد	لا	`32768`	الحد الأقصى للعلامات المحجوزة لعملية التعليل حتى 131072 - الرنج: 1 - 131072

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/glm-5-2.