MiMo V2.5

Xiaomi · Text Generation
POST /v1/chat/completions多模态模型,基于100万上下文,具备原生视觉和听觉理解,旨在跨模态推理和行动,在代理工作流中进行推理和行动。
一眼看
定价
示例请求
参数
注释
全模态输入(文本、图像、视频、音频)与文本输出。网络搜索($0.015/call)只有在被调用时才会收费。缓存输入代币会被大幅折扣收费。
按工具计费(usage.tool_usage)
当该模型在单一请求中调用工具(如网页搜索、代码解释器等)时,响应会携带一个归一化的usage.tool_usage映射,同时显示令牌计数。下面的示例展示了形状 - - 具体字段名称、单位以及出现的工具可能因提供者而略有差异:
工具数量已经被纳入cost_usd - - 它们被展示出来以保持透明,以便你审计每件工具的计费。当没有工具被调用时,该字段被省略。
Machine可读模式: GET https://api.empiriolabs.ai/v1/models/mimo-v2-5。
