Qwen3 Max Thinking

Qwen3 Max Thinking
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Reasoning model with adaptive tool use (search, memory, code interpreter) and test-time scaling for higher accuracy on complex tasks.

This model is deprecated and will be retired on 2026-07-08. After that date, requests to this model will fail. Migrate to a successor model before then.

في لمحة

الميدانالقيمة
النموذجqwen3-max-thinking
تاريخ الإفراج النموذجي2025-09-23
طرائق المدخلاتالنص
طرائق النواتجالنص
نافذة السياق256K
دقة الوزن-
الحد الأقصى للنواتج65,536
المنطقةسنغافورة
المعالمالمنطق، الشفرة… المترجم…
Native inferenceلا
جديدةلا
نقاط النهاية المدعومةPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages
تاريخ الاستهلاك2026-07-08

الطباعة

الرسمSpecالمعدل
الناتج1M<=32K $1.08 (كان $1.20); 32K-128K $2.16 (كان $2.40); 128K-256K $2.70 (كان $3.00)
الناتج1M المولدة<=32K $5.52 (كان $6.00); 32K-128K $11.04 (كان $12.00); 128K-256K $13.80 (كان $15.00)
Web searchلكل طلب$0.015

طلب مثال

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-max-thinking", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
temperatureالعددلا0.7درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
top_pالعددلا0.9نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
max_tokensالعددلا4096الحد الأقصى للعلامات في الرد الرنج: 1-65536
stopسلسلةلا-حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
enable_thinkingbooleanلاصحيحطريقة تفكير مطولة أبطأ، ولكن يحسن المهام الحثيثة.
tool_web_searchbooleanلاكاذبالسماح للنموذج بإجراء عمليات تفتيش على الشبكة عند الحاجة.
web_search_modeenumلا"standard"المعيار = بحث واحد، دقيق = عدة عمليات بحث أعمق. · مسموح: standard، thorough
tool_code_interpreterbooleanلاصحيحالسماح للنموذج لتنفيذ رمز (بايتون) في صندوق رمال لحصر البيانات/تحليلها
tool_web_extractorbooleanلاصحيحاسمحوا للنموذج أن يجلب ويقرأ المحتوى من URLs يكتشف.
disable_formattingbooleanلاكاذبSkip the EmpirioLabs Markdown formatting (citation [N] rewriting + References block when web search / tools were used). ويعاد الرد النافذ على الاستشهاد البسيط.

الحواشي

(ب) أساليب البحث على شبكة الإنترنت: المعيار (العامل) أو الثوروغ (المفهوم، يتطلب التفكير).

الفوترة لكل أداة (usage.tool_usage)

When this model invokeds tools (web search, code interpreter, etc.) inside a single request, the response carries a normalized EL usage.tool_usage map along the token counts. ويوضح المثال الوارد أدناه الشكل - الاسمان الميدانيان الدقيقان، والوحدات، والأدوات التي تظهر يمكن أن تختلف اختلافا طفيفا لكل مقدم:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

يتم بالفعل احتساب عدد الأدوات في cost_usd - يتم إبراز الشفافية حتى تتمكن من تدقيق الفوترة لكل أداة. يتم حذف الحقل عندما لا يتم استدعاء أي أدوات.


مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/qwen3-max-thinking.