Qwen3.5 122B-A10B

Qwen3.5 122B-A10B
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Qwen3.5 122B-A10B 256K संदर्भ, कुशल विरल MoE अनुमान और पाठ, छवि और वीडियो इनपुट के साथ एक मल्टीमॉडल तर्क मॉडल है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीqwen3-5-122b-a10b
मॉडल रिलीज की तारीख2026-02-24
इनपुट तौर-तरीकेपाठ, छवि, वीडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो256 के
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन64,000
क्षेत्रचीन
सुविधाऐंरीजनिंग, विजन, web_search, function_calling, structured_output, मल्टीमॉडल
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन<=128K $0.115 ($0.40 था); 128K-256K $0.287 ($0.40 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन<=128K $0.917 ($3.20 था); 128K-256K $2.294 ($3.20 था)
वेब खोजसक्षम होने पर प्रति अनुरोध$0.01

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-5-122b-a10b", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 नियतात्मक है और 2 अधिकतम यादृच्छिकता है। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। कम मान आउटपुट को अधिक केंद्रित बनाते हैं। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 64000
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
enable_thinkingबूलियननहींसचउत्तर देने से पहले तर्क सक्षम करें।
thinking_budgetसंख्यानहीं32768सोच सक्षम होने पर तर्क के लिए आरक्षित अधिकतम टोकन। · रेंज: 1 - 80000
reasoning_effortएनमनहीं"medium"तर्क प्रयास स्तर। कोई भी सोच को अक्षम नहीं करता है। निम्न, मध्यम, उच्च और अधिकतम सेट चयनित मॉडल के आकार के बाउंड थिंकिंग बजट। OpenAI-शैली reasoning_effort फ़ील्ड के रूप में भेजा गया, मॉडल सेवा के लिए enable_thinking और thinking_budget में अनुवादित किया गया। · अनुमति: none, low, medium, high, max
vl_high_resolution_imagesबूलियननहींसचछवि इनपुट के लिए उच्च रिज़ॉल्यूशन प्रसंस्करण का उपयोग करें।
max_pixelsसंख्यानहीं2621440उच्च रिज़ॉल्यूशन प्रसंस्करण अक्षम होने पर प्रति छवि अधिकतम पिक्सेल गणना। · रेंज: 4096 - 16777216
video_fpsसंख्यानहीं2वीडियो इनपुट से नमूना लेने के लिए प्रति सेकंड फ्रेम। · रेंज: 0.1 - 10
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें। सक्षम होने पर अनुरोध लागत में $0.01 जोड़ता है।

टिप्पणियाँ

टेक्स्ट, छवि और वीडियो इनपुट का समर्थन करता है। वेब खोज tool_web_search के माध्यम से उपलब्ध है और सक्षम होने पर प्रति अनुरोध $0.01 जोड़ती है. थिंकिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-5-122b-a10b