GLM 5.1

GLM 5.1
Z.ai · Text Generation
/v1/chat/completions

Long-context Zhipu AI reasoning model with 202K context, 128K output, tool calling, structured output, and cache support.

في لمحة

الميدانالقيمة
النموذجglm-5-1
تاريخ الإفراج النموذجي2026-04-07
طرائق المدخلاتالنص
طرائق النواتجالنص
نافذة السياق202K
دقة الوزن-
المنطقةالصين
المعالمالتعليل، الوظيفة
Native inferenceلا
جديدةنعم
نقاط النهاية المدعومة/v1/chat/completions, /v1/responses, /v1/messages

الطباعة

الرسمSpecالمعدل
الناتج1M<=32K $0.825 (كان $1.40); 32K-200K $1.10 (كان $1.40)
الناتج1M المولدة<=32K $3.301 (كان $4.40); 32K-200K $3.851 (كان $4.40)
يُقرأ المخبأ1M cached input tokens<=32K $0.165 (كان $0.26); 32K-200K $0.22 (كان $0.26)
البحث على شبكة الإنترنت (Linkup)عند التذرع$0.013

طلب مثال

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "glm-5-1", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
max_tokensintegerلا4096أكبر عدد من مكامن الإنتاج لتوليدها. الرنج: 1-128000
temperatureالعددلا1تحكم عشوائي فالقيم الدنيا تجعل الاستجابات أكثر تحديدا. الرنج: صفر - 2
top_pالعددلا0.95(ناكليوس) يقطع العينات الرنج: صفر - 1
top_kintegerلا20”الحيازات تتجه إلى أعلى “كي توكس الرنج: 1 - 100
repetition_penaltyالعددلا1يُعاقبون على مُتكررين. الرنج: 0.1 - 2
reasoning_effortenumلا"medium"مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: none، low، medium، high، max
enable_thinkingbooleanلاصحيحإسمح للنموذج بالعقل قبل الإجابة عطل هذا من أجل الناتج المنظم الصارم.
thinking_budgetintegerلا32768الحد الأقصى للكميات المتاحة للتفسير في المحتوى عندما يُمكن التفكير الرنج: 1-38912
tool_streambooleanلاكاذبتجمّع الحجج عن العمل بشكل تدريجي عندما تتدفق
toolsصفائفلا[]OpenAI-compatible function calling tool definitions.
tool_choiceالجسملا-التحكم في اختيار الأدوات المتوافقة
parallel_tool_callsbooleanلاصحيحالسماح لمكالمات متعددة في دور مساعد واحد عند دعمه.
response_formatالجسملا-OpenAI-compatible JSON mode or JSON schema response format. استخدمي أسلوب عدم التفكير في الكيماويات الصارمة
stopصفائفلا-وقف اختياري
web_search_linkupbooleanلاكاذببحث ويب اختياري مدعوم من لينك أب. عند تفعيلها، يتم استرجاع مصادر الويب الحديثة باستخدام رسالة المستخدم الأخيرة كاستعلام وتقديمها للنموذج كسياق إضافي. يضيف $0.013 ثابتة لكل طلب بالإضافة إلى تكلفة الرمز العادية للنموذج. معطلة بشكل افتراضي.
disable_formattingbooleanلاكاذبعند تفعيلها، لا تضم البوابة تذيل “المصادر” إلى ردود المساعدين التي استخدمت Linkup البحث على الويب. مفيد عندما يتم نقل مخرج النموذج إلى نظام آخر لا يتوقع أي زخرفة.

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/glm-5-1.