GLM 5.1 | EmpirioLabs AI Docs

Z.ai · Text Generation

/v1/chat/completions

Long-context Zhipu AI reasoning model with 202K context, 128K output, tool calling, structured output, and cache support.

في لمحة

الميدان	القيمة
النموذج	`glm-5-1`
تاريخ الإفراج النموذجي	2026-04-07
طرائق المدخلات	النص
طرائق النواتج	النص
نافذة السياق	202K
دقة الوزن	-
المنطقة	الصين
المعالم	التعليل، الوظيفة
Native inference	لا
جديدة	نعم
نقاط النهاية المدعومة	`/v1/chat/completions`, `/v1/responses`, `/v1/messages`

الطباعة

الرسم	Spec	المعدل
الناتج	1M	<=32K $0.825 (كان $1.40); 32K-200K $1.10 (كان $1.40)
الناتج	1M المولدة	<=32K $3.301 (كان $4.40); 32K-200K $3.851 (كان $4.40)
يُقرأ المخبأ	1M cached input tokens	<=32K $0.165 (كان $0.26); 32K-200K $0.22 (كان $0.26)
البحث على شبكة الإنترنت (Linkup)	عند التذرع	$0.013

طلب مثال

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "glm-5-1", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامترات	النوع	المطلوبة	التقصير	الوصف
`max_tokens`	integer	لا	`4096`	أكبر عدد من مكامن الإنتاج لتوليدها. الرنج: 1-128000
`temperature`	العدد	لا	`1`	تحكم عشوائي فالقيم الدنيا تجعل الاستجابات أكثر تحديدا. الرنج: صفر - 2
`top_p`	العدد	لا	`0.95`	(ناكليوس) يقطع العينات الرنج: صفر - 1
`top_k`	integer	لا	`20`	”الحيازات تتجه إلى أعلى “كي توكس الرنج: 1 - 100
`repetition_penalty`	العدد	لا	`1`	يُعاقبون على مُتكررين. الرنج: 0.1 - 2
`reasoning_effort`	enum	لا	`"medium"`	مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: `none`، `low`، `medium`، `high`، `max`
`enable_thinking`	boolean	لا	صحيح	إسمح للنموذج بالعقل قبل الإجابة عطل هذا من أجل الناتج المنظم الصارم.
`thinking_budget`	integer	لا	`32768`	الحد الأقصى للكميات المتاحة للتفسير في المحتوى عندما يُمكن التفكير الرنج: 1-38912
`tool_stream`	boolean	لا	كاذب	تجمّع الحجج عن العمل بشكل تدريجي عندما تتدفق
`tools`	صفائف	لا	`[]`	OpenAI-compatible function calling tool definitions.
`tool_choice`	الجسم	لا	-	التحكم في اختيار الأدوات المتوافقة
`parallel_tool_calls`	boolean	لا	صحيح	السماح لمكالمات متعددة في دور مساعد واحد عند دعمه.
`response_format`	الجسم	لا	-	OpenAI-compatible JSON mode or JSON schema response format. استخدمي أسلوب عدم التفكير في الكيماويات الصارمة
`stop`	صفائف	لا	-	وقف اختياري
`web_search_linkup`	boolean	لا	كاذب	بحث ويب اختياري مدعوم من لينك أب. عند تفعيلها، يتم استرجاع مصادر الويب الحديثة باستخدام رسالة المستخدم الأخيرة كاستعلام وتقديمها للنموذج كسياق إضافي. يضيف $0.013 ثابتة لكل طلب بالإضافة إلى تكلفة الرمز العادية للنموذج. معطلة بشكل افتراضي.
`disable_formatting`	boolean	لا	كاذب	عند تفعيلها، لا تضم البوابة تذيل “المصادر” إلى ردود المساعدين التي استخدمت Linkup البحث على الويب. مفيد عندما يتم نقل مخرج النموذج إلى نظام آخر لا يتوقع أي زخرفة.

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/glm-5-1.