MiMo V2.5

POST /v1/chat/completionsModelo multimodal con comprensión visual y auditiva nativa en un contexto 1M, diseñado para razonar y actuar a través de modalidades en flujos de trabajo agentivos.
A simple vista
Precios
Solicitud de ejemplo
Parámetros
Notas
Entrada omnimodal (texto, imagen, vídeo, audio) con salida de texto. La búsqueda web ($0.015/call) solo se cobra cuando se invoca. Los tokens de entrada en caché se facturan con un gran descuento.
Facturación por herramienta (usage.tool_usage)
Cuando este modelo invoca herramientas (búsqueda web, intérprete de código, etc.) dentro de una sola petición, la respuesta lleva un mapa de usage.tool_usage normalizado junto con los conteos de tokens. El siguiente ejemplo muestra la forma - los nombres exactos de campos, unidades y qué herramientas aparecen pueden variar ligeramente según el proveedor:
El número de herramientas ya está en cost_usd - se perfilan para transparencia y así puedes auditar la facturación por herramienta. El campo se omite cuando no se invocan herramientas.
Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/mimo-v2-5.
