Mistral Small 4

Mistral Small 4
Mistral AI · Text Generation
POST /v1/chat/completions

हाइब्रिड मॉडल एकीकृत निर्देश, तर्क (मैजिस्ट्रल), और डेवस्ट्रल परिवार: 40% कम पूर्णता समय और 3x थ्रूपुट बनाम छोटा 3।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीmistral-small-4
मॉडल रिलीज की तारीख2026-03-16
इनपुट तौर-तरीकेपाठ, छवि
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो256 के
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन65,536
सुविधाऐंदृष्टि
मूल अनुमाननहीं
नयानहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.15
उत्पादनप्रति 1M जेनरेट किए गए टोकन$0.60
मानक वेब खोजप्रति कॉल$0.084
प्रीमियम वेब खोजप्रति कॉल$0.140
कोड दुभाषियाप्रति कॉल$0.084
छवि निर्माणप्रति छवि$0.280

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "mistral-small-4", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
reasoning_enabledबूलियननहींसचविस्तारित तर्क सक्षम करें (तर्क के लिए मानचित्र: उच्च|कोई नहीं)
tool_web_searchबूलियननहींसचweb_search उपकरण सक्षम करें
web_search_tierएनमनहीं"standard"मानक या प्रीमियम वेब-खोज स्तर। प्रीमियम उच्च गुणवत्ता वाले स्रोतों का उपयोग करता है। · अनुमति: standard, premium
tool_code_interpreterबूलियननहींसचडेटा की गणना/विश्लेषण करने के लिए मॉडल को सैंडबॉक्स में पायथन कोड निष्पादित करने की अनुमति दें।
tool_image_generationबूलियननहींसचमॉडल को प्लेटफ़ॉर्म इमेज-जेन टूल के माध्यम से इनलाइन इमेज जेनरेट करने की अनुमति दें।
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 1.5
max_tokensसंख्यानहीं4096प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 32768
disable_formattingबूलियननहींगलतEmpirioLabs मार्कडाउन स्वरूपण (उद्धरण [N] पुनर्लेखन + संदर्भ ब्लॉक जब web_search उपकरण का उपयोग किया गया था) को छोड़ें। सादे [N] उद्धरणों के साथ कच्चा अपस्ट्रीम उत्तर वापस कर दिया जाता है।

टिप्पणियाँ

उपकरण (वेब खोज, कोड दुभाषिया, छवि निर्माण) केवल तभी बिल किए जाते हैं जब वास्तव में लागू किया जाता है।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर अंतर्निहित टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र को वहन करती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/mistral-small-4