MiMo V2 Flash

POST /v1/chat/completionsहल्के, उच्च गति तर्क मॉडल हाइब्रिड ध्यान और कम लागत वाले अनुमान और मजबूत बेंचमार्क स्कोर के लिए बहु-टोकन भविष्यवाणी के साथ।
एक नजर में
मूल्य निर्धारण
उदाहरण अनुरोध
पैरामीटर
टिप्पणियाँ
लाइटवेट 256K-संदर्भ स्तर। वेब खोज ($0.015/call) केवल तभी शुल्क लिया जाता है जब उसे लागू किया जाता है. कैश्ड इनपुट टोकन को भारी छूट पर बिल किया जाता है।
प्रति-उपकरण बिलिंग (usage.tool_usage)
जब यह मॉडल एक ही अनुरोध के अंदर टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र ले जाती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:
टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।
Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/mimo-v2-flash।
