GLM 5.2

GLM 5.2
Z.ai · Text Generation
/v1/chat/completions

Reasoning and coding model with a 1M token context, 128K output, adjustedable reasoning effort, native web search, and tool calling.

في لمحة

الميدانالقيمة
النموذجglm-5-2
تاريخ الإفراج النموذجي2026-06-16
طرائق المدخلاتالنص
طرائق النواتجالنص
نافذة السياق1M
دقة الوزن-
الحد الأقصى للنواتج131,072
المنطقةسنغافورة
المعالمالتعليل، الوظيفة - التصاميم، النواتج المنظمة، البحث الشبكي
Native inferenceلا
جديدةنعم
نقاط النهاية المدعومة/v1/chat/completions, /v1/responses, /v1/messages

الطباعة

الرسمSpecالمعدل
الناتج1M$1.40
الناتج1M المولدة$4.40
Web searchلكل طلب$0.033

طلب مثال

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-5-2", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
max_tokensintegerلا65536أكبر عدد من مكامن الإنتاج لتوليدها. الرنج: 1-131072
temperatureالعددلا1تحكم عشوائي فالقيم الدنيا تجعل الاستجابات أكثر تحديدا. الرنج: صفر - 1
top_pالعددلا0.95(ناكليوس) يقطع العينات الرنج: 0.01 - 1
reasoning_effortenumلا"max"جهد استدلالي GLM-5.2. لا أحد يعيق التفكير؛ الحد الأدنى حتى الحد الأقصى حدد مدى صعوبة النموذج قبل الإجابة. يوصى ب MAX للبرمجة المعقدة. · مسموح: none، minimal، low، medium، high، xhigh، max
enable_thinkingbooleanلاصحيحإسمح للنموذج بالعقل قبل الإجابة أطفأ لأدنى الردود أو للناتج المنظم الصارم.
do_samplebooleanلاصحيحأخذ عينات اتجهوا نحو الناتج المحدد الجشع (تم تجاهل التمرينات والأعلى).
tool_web_searchbooleanلاكاذبفعل البحث المدمج على الويب. يضيف $0.033 لكل طلب عند استخدامه.
search_recency_filterenumلا"noLimit"حدد نتائج البحث على الويب في نافذة حديثة. · مسموح ب: oneDay، oneWeek، oneMonth، oneYear، noLimit
countintegerلا10Number of web search results to retrieve when web search is enabled. الرنج: 1 - 50
search_domain_filterسلسلةلا-تقييد البحث على شبكة الإنترنت إلى مجال محدد.
search_promptسلسلةلا-وسرعتها الاختيارية تستخدم لتلخيص نتائج البحث على الشبكة.
search_resultbooleanلاصحيحRe web search result metadata in the response when web search is enabled.
tool_streambooleanلاكاذبتجمّع الحجج عن العمل بشكل تدريجي عندما تتدفق
toolsصفائفلا[]OpenAI-compatible function calling tool definitions.
tool_choiceالجسملا-التحكم في اختيار الأدوات المتوافقة
response_formatالجسملا-أسلوب (الجوسون) المفتوح استخدام التفكير المعاق للحصول على ناتج منظم صارم.
stopصفائفلا-التوقيف الاختياري (حتى 4).

المتغيرات

:variant1

الميدانالقيمة
النموذجglm-5-2:variant1
تاريخ الإفراج النموذجي2026-06-16
المنطقةألمانيا
نافذة السياق1M
دقة الوزن-
الحد الأقصى للنواتج131,072
المعالمالتعليل، الوظيفة
Native inferenceلا
نقاط النهاية المدعومةPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

** تسعير**

الرسمSpecالمعدل
الناتج1M$1.10 (كان $1.40)
الناتج1M المولدة$3.851 (كان $4.40)
يُقرأ المخبأ1M cached input tokens$0.275

** بارامترات**

البارامتراتالنوعالمطلوبةالتقصيرالوصف
temperatureالعددلا0.7درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
top_pالعددلا0.9نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
max_tokensالعددلا4096الحد الأقصى للناتج الرنج: 1-131072
stopسلسلةلا-حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
enable_thinkingbooleanلاصحيحفعل step-by-step المنطق قبل الإجابة.
reasoning_effortenumلا"medium"مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: none، low، medium، high، max
thinking_budgetالعددلا32768الحد الأقصى للعلامات المحجوزة لعملية التعليل حتى 131072 - الرنج: 1 - 131072

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/glm-5-2.