MiMo V2.5 | EmpirioLabs AI Docs

Xiaomi · Text Generation

POST /v1/chat/completions

Multimodal model with native visual and audio understanding on a 1M context, designed to reason and act across modalities in agentic workflows.

في لمحة

الميدان	القيمة
النموذج	`mimo-v2-5`
تاريخ الإفراج النموذجي	2026-04-22
طرائق المدخلات	النص، التصوير، الفيديو، أوديو
طرائق النواتج	النص
نافذة السياق	1M
دقة الوزن	-
الحد الأقصى للنواتج	128,000
المعالم	رؤية صوتية
Native inference	لا
جديدة	نعم
نقاط النهاية المدعومة	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

الطباعة

الرسم	Spec	المعدل
الناتج	1M	$0.70
الناتج	1M المولدة	$1.40
يُقرأ المخبأ	1M cached input tokens	$0.014
Web search	لكل مكالمة	$0.015

طلب مثال

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "mimo-v2-5", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامترات	النوع	المطلوبة	التقصير	الوصف
`enable_thinking`	boolean	لا	صحيح	طريقة تفكير مطولة أبطأ، ولكن يحسن المهام الحثيثة.
`tool_web_search`	boolean	لا	كاذب	السماح للنموذج بإجراء عمليات تفتيش على الشبكة عند الحاجة.
`web_search_force`	boolean	لا	كاذب	إجبرْ النموذجَ دائماً أَنْ يُديرَ a بحث على الشبكةِ قبل الإجابة.
`web_search_max_keyword`	العدد	لا	`3`	(ماكس) عدد الكلمات الرئيسية التي يمكن أن يستخدمها النموذج عبر البحث على الشبكة الرنج: 1 - 5
`web_search_limit`	العدد	لا	`5`	يُمكن للنموذج أن يؤدي كل طلب الرنج: 1 - 10
`video_fps`	العدد	لا	`2`	تم أخذ عينة من شريط فيديو من أجل التحليل الرنج: 0.1 - 10
`video_resolution`	enum	لا	`"default"`	الدقة التي يتم فيها أخذ عينات الفيديو المدخل (مثل 360p، 480p، 720p). · مسموح: `default`، `max`
`temperature`	العدد	لا	`0.7`	درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
`top_p`	العدد	لا	`0.9`	نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
`max_tokens`	العدد	لا	`4096`	الحد الأقصى للعلامات في الرد الرنج: 1-65536
`stop`	سلسلة	لا	-	حتى 4 خيوط حيث النموذج سيتوقف عن توليد المزيد من الكسور
`disable_formatting`	boolean	لا	كاذب	Skip the EmpirioLabs Markdown formatting (citation [N] rewriting + References block when web search was used). ويعاد الرد النافذ على الاستشهاد البسيط.

الحواشي

إدخال شامل الوسائط (نص، صورة، فيديو، صوت) مع إخراج نصي. يتم احتساب رسوم البحث على الويب ($0.015/call) فقط عند تفعيله. يتم احتساب رموز الإدخال المخزنة بخصم كبير.

الفوترة لكل أداة (usage.tool_usage)

When this model invokeds tools (web search, code interpreter, etc.) inside a single request, the response carries a normalized EL usage.tool_usage map along the token counts. ويوضح المثال الوارد أدناه الشكل - الاسمان الميدانيان الدقيقان، والوحدات، والأدوات التي تظهر يمكن أن تختلف اختلافا طفيفا لكل مقدم:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

يتم بالفعل احتساب عدد الأدوات في cost_usd - يتم إبراز الشفافية حتى تتمكن من تدقيق الفوترة لكل أداة. يتم حذف الحقل عندما لا يتم استدعاء أي أدوات.

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/mimo-v2-5.