MiMo V2.5

MiMo V2.5
Xiaomi · Text Generation
POST /v1/chat/completions

1M संदर्भ पर देशी दृश्य और ऑडियो समझ के साथ मल्टीमॉडल मॉडल, एजेंट वर्कफ़्लो में तौर-तरीकों में तर्क और कार्य करने के लिए डिज़ाइन किया गया है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीmimo-v2-5
मॉडल रिलीज की तारीख2026-04-22
इनपुट तौर-तरीकेपाठ, छवि, वीडियो, ऑडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो1 मी
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन128,000
सुविधाऐंदृष्टि, audio_in
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.70
उत्पादनप्रति 1M जेनरेट किए गए टोकन$1.40
अंतर्निहित कैश पढ़ा गयाप्रति 1M कैश्ड इनपुट टोकन$0.014
वेब खोजप्रति कॉल$0.015

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "mimo-v2-5", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
enable_thinkingबूलियननहींसचविस्तारित सोच मोड सक्षम करें। धीमा लेकिन तर्क-भारी कार्यों में सुधार करता है।
tool_web_searchबूलियननहींगलतजरूरत पड़ने पर मॉडल को वेब खोज करने की अनुमति दें।
web_search_forceबूलियननहींगलतउत्तर देने से पहले मॉडल को हमेशा वेब खोज चलाने के लिए बाध्य करें।
web_search_max_keywordसंख्यानहीं3कीवर्ड की अधिकतम संख्या मॉडल वेब खोजों में उपयोग कर सकता है। · रेंज: 1 - 5
web_search_limitसंख्यानहीं5वेब खोजों की अधिकतम संख्या मॉडल प्रति अनुरोध कर सकता है। · रेंज: 1 - 10
video_fpsसंख्यानहीं2विश्लेषण के लिए इनपुट वीडियो से फ्रेम्स-प्रति-सेकंड का नमूना लिया गया। · रेंज: 0.1 - 10
video_resolutionएनमनहीं"default"रिज़ॉल्यूशन जिस पर इनपुट वीडियो का नमूना लिया जाता है (जैसे 360p, 480p, 720p)। · अनुमति: default, max
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 65536
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
disable_formattingबूलियननहींगलतEmpirioLabs मार्कडाउन स्वरूपण (उद्धरण [N] पुनर्लेखन + संदर्भ ब्लॉक जब वेब खोज का उपयोग किया गया था) को छोड़ें। सादे [N] उद्धरणों के साथ कच्चा अपस्ट्रीम उत्तर वापस कर दिया जाता है।

टिप्पणियाँ

पाठ आउटपुट के साथ सर्वव्यापी इनपुट (पाठ, छवि, वीडियो, ऑडियो)। वेब खोज ($0.015/call) केवल तभी शुल्क लिया जाता है जब उसे लागू किया जाता है. कैश्ड इनपुट टोकन को भारी छूट पर बिल किया जाता है।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र ले जाती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/mimo-v2-5