MiMo V2 Flash

POST /v1/chat/completionsModelo de raciocínio leve e de alta velocidade, com atenção híbrida e previsão multi-token para inferência de baixo custo e pontuações de benchmark fortes.
De um olhar
Precificação
Exemplo de pedido
Parâmetros
Notas
Nível de contexto leve de 256K. A busca na web ($0.015/call) é cobrada apenas quando invocada. Tokens de entrada em cache são faturados com um grande desconto.
Faturamento por ferramenta (usage.tool_usage)
Quando esse modelo invoca ferramentas (busca web, interpretador de código, etc.) dentro de uma única requisição, a resposta carrega um mapa de usage.tool_usage normalizado junto com as contagens de tokens. O exemplo abaixo mostra a forma - nomes exatos de campos, unidades e quais ferramentas aparecem podem variar ligeiramente de acordo com o provedor:
A contagem de ferramentas já está em conta cost_usd - elas são apresentadas para transparência, permitindo auditar o faturamento por ferramenta. O campo é omitido quando nenhuma ferramenta foi invocada.
Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/mimo-v2-flash.
