GLM 5.2

Z.ai · Text Generation
/v1/chat/completionsReasoning and coding model with a 1M token context, 128K output, adjustedable reasoning effort, native web search, and tool calling.
في لمحة
| الميدان | القيمة |
|---|---|
| النموذج | glm-5-2 |
| تاريخ الإفراج النموذجي | 2026-06-16 |
| طرائق المدخلات | النص |
| طرائق النواتج | النص |
| نافذة السياق | 1M |
| دقة الوزن | - |
| الحد الأقصى للنواتج | 131,072 |
| المنطقة | سنغافورة |
| المعالم | التعليل، الوظيفة - التصاميم، النواتج المنظمة، البحث الشبكي |
| Native inference | لا |
| جديدة | نعم |
| نقاط النهاية المدعومة | /v1/chat/completions, /v1/responses, /v1/messages |
الطباعة
| الرسم | Spec | المعدل |
|---|---|---|
| الناتج | 1M | $1.40 |
| الناتج | 1M المولدة | $4.40 |
| Web search | لكل طلب | $0.033 |
طلب مثال
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "glm-5-2", "messages": [{"role":"user","content":"Hello"}]}'
البارامترات
| البارامترات | النوع | المطلوبة | التقصير | الوصف |
|---|---|---|---|---|
max_tokens | integer | لا | 65536 | أكبر عدد من مكامن الإنتاج لتوليدها. الرنج: 1-131072 |
temperature | العدد | لا | 1 | تحكم عشوائي فالقيم الدنيا تجعل الاستجابات أكثر تحديدا. الرنج: صفر - 1 |
top_p | العدد | لا | 0.95 | (ناكليوس) يقطع العينات الرنج: 0.01 - 1 |
reasoning_effort | enum | لا | "max" | جهد استدلالي GLM-5.2. لا أحد يعيق التفكير؛ الحد الأدنى حتى الحد الأقصى حدد مدى صعوبة النموذج قبل الإجابة. يوصى ب MAX للبرمجة المعقدة. · مسموح: none، minimal، low، medium، high، xhigh، max |
enable_thinking | boolean | لا | صحيح | إسمح للنموذج بالعقل قبل الإجابة أطفأ لأدنى الردود أو للناتج المنظم الصارم. |
do_sample | boolean | لا | صحيح | أخذ عينات اتجهوا نحو الناتج المحدد الجشع (تم تجاهل التمرينات والأعلى). |
tool_web_search | boolean | لا | كاذب | فعل البحث المدمج على الويب. يضيف $0.033 لكل طلب عند استخدامه. |
search_recency_filter | enum | لا | "noLimit" | حدد نتائج البحث على الويب في نافذة حديثة. · مسموح ب: oneDay، oneWeek، oneMonth، oneYear، noLimit |
count | integer | لا | 10 | Number of web search results to retrieve when web search is enabled. الرنج: 1 - 50 |
search_domain_filter | سلسلة | لا | - | تقييد البحث على شبكة الإنترنت إلى مجال محدد. |
search_prompt | سلسلة | لا | - | وسرعتها الاختيارية تستخدم لتلخيص نتائج البحث على الشبكة. |
search_result | boolean | لا | صحيح | Re web search result metadata in the response when web search is enabled. |
tool_stream | boolean | لا | كاذب | تجمّع الحجج عن العمل بشكل تدريجي عندما تتدفق |
tools | صفائف | لا | [] | OpenAI-compatible function calling tool definitions. |
tool_choice | الجسم | لا | - | التحكم في اختيار الأدوات المتوافقة |
response_format | الجسم | لا | - | أسلوب (الجوسون) المفتوح استخدام التفكير المعاق للحصول على ناتج منظم صارم. |
stop | صفائف | لا | - | التوقيف الاختياري (حتى 4). |
المتغيرات
:variant1
| الميدان | القيمة |
|---|---|
| النموذج | glm-5-2:variant1 |
| تاريخ الإفراج النموذجي | 2026-06-16 |
| المنطقة | ألمانيا |
| نافذة السياق | 1M |
| دقة الوزن | - |
| الحد الأقصى للنواتج | 131,072 |
| المعالم | التعليل، الوظيفة |
| Native inference | لا |
| نقاط النهاية المدعومة | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
** تسعير**
| الرسم | Spec | المعدل |
|---|---|---|
| الناتج | 1M | $1.10 (كان $1.40) |
| الناتج | 1M المولدة | $3.851 (كان $4.40) |
| يُقرأ المخبأ | 1M cached input tokens | $0.275 |
** بارامترات**
| البارامترات | النوع | المطلوبة | التقصير | الوصف |
|---|---|---|---|---|
temperature | العدد | لا | 0.7 | درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2 |
top_p | العدد | لا | 0.9 | نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1 |
max_tokens | العدد | لا | 4096 | الحد الأقصى للناتج الرنج: 1-131072 |
stop | سلسلة | لا | - | حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور |
enable_thinking | boolean | لا | صحيح | فعل step-by-step المنطق قبل الإجابة. |
reasoning_effort | enum | لا | "medium" | مستوى جهد التفكير. لا أحد يعيق التفكير. المنخفض والمتوسط والعالي والقصوى يحدد ميزانيات التفكير المحدودة حسب النموذج المختار. تم إرسالها كحقل reasoning_effort على غرار OpenAI، وترجمت إلى enable_thinking و thinking_budget لخدمة النماذج. · مسموح ب: none، low، medium، high، max |
thinking_budget | العدد | لا | 32768 | الحد الأقصى للعلامات المحجوزة لعملية التعليل حتى 131072 - الرنج: 1 - 131072 |
مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/glm-5-2.
