MiMo V2 Flash

Xiaomi · Text Generation
POST /v1/chat/completions轻量级、高速推理模型,采用混合注意力和多符号预测,实现低成本推断和强劲的基准分数。
一眼看
定价
示例请求
参数
注释
轻量级256K上下文层。网络搜索($0.015/call)只有在被调用时才会收费。缓存输入代币会被大幅折扣收费。
按工具计费(usage.tool_usage)
当该模型在单一请求中调用工具(如网页搜索、代码解释器等)时,响应会携带一个归一化的usage.tool_usage映射,同时显示令牌计数。下面的示例展示了形状 - - 具体字段名称、单位以及出现的工具可能因提供者而略有差异:
工具数量已经被纳入cost_usd - - 它们被展示出来以保持透明,以便你审计每件工具的计费。当没有工具被调用时,该字段被省略。
Machine可读模式: GET https://api.empiriolabs.ai/v1/models/mimo-v2-flash。
