MiniMax M2.7 Highspeed

MiniMax M2.7 Highspeed
MiniMax · Text Generation
POST /v1/chat/completions

हाई-स्पीड M2.7 वैरिएंट को मजबूत एजेंट क्षमताओं के साथ मजबूत सामान्य-उद्देश्य प्रदर्शन के साथ तेजी से अनुमान लगाने के लिए ट्यून किया गया है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीminimax-m2-7-highspeed
मॉडल रिलीज की तारीख2026-03-18
इनपुट तौर-तरीकेटेक्स्ट
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो200 हजार
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन32,768
क्षेत्रसिंगापुर
सुविधाऐंतर्कपूर्ण आधार
मूल अनुमाननहीं
नयानहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.30 ($0.60 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन$1.20 ($2.40 था)
अंतर्निहित कैश पढ़ा गयाप्रति 1M कैश्ड इनपुट टोकन$0.03 ($0.06 था)
वेब खोज (Linkup)प्रति कॉल जब लागू किया जाता है$0.013

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m2-7-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं1.0नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.95नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 131072
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
toolsसरणीनहीं-OpenAI-शैली फ़ंक्शन-कॉलिंग टूल परिभाषाएँ। प्रत्येक प्रविष्टि में नाम, विवरण, पैरामीटर होते हैं।
tool_choiceतारनहीं-स्‍वचालित| कोई नहीं| आवश्यक | {प्रकार: फ़ंक्शन, फ़ंक्शन: {नाम: ”…”}}। नियंत्रित करता है कि मॉडल को कब किसी उपकरण को कॉल करना चाहिए।
web_search_linkupबूलियननहींगलतलिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
disable_formattingबूलियननहींगलतसक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

टिप्पणियाँ

~ 100 tokens/sec आउटपुट के साथ M2.7 के समान फ्रंटियर प्रदर्शन। इंटरलीव्ड सोच हमेशा चालू रहती है (कोई टॉगल नहीं)।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/minimax-m2-7-highspeed