MiniMax M3

MiniMax M3
MiniMax · Text Generation
POST /v1/chat/completions

MiniMax M3 é um modelo de raciocínio multimodal para codificação, agentes e análise de longo contexto com entrada de texto, imagem e vídeo.

De um olhar

CampoValor
ID do modelominimax-m3
Data de lançamento do modelo2026-06-01
Modalidades de entradaTexto, Imagem, Vídeo
Modalidades de saídaTexto
Janela de contexto524K
Precisão do peso-
Tokens de saída máxima524,288
RegiãoSingapura
CaracterísticasRaciocínio, visão, vídeo, web_search, function_calling, cache, long_context
Inferência nativaNão
NovoSim
Endpoints suportadosPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Precificação

CargaEspecificaçãoTaxa
Entradapor 1M de tokens de prompt<=512K $0.225 (era $0.30); >512K $1.20
Produçãopor 1M de tokens gerados<=512K $0.90 (era $1.20); >512K $4.80
Leitura implícita do cachepor 1M de tokens de entrada cacheados<=512K $0.045 (era $0.06); >512K $0.24
Busca na web do Linkuppor busca bem-sucedida quando ativada$0.013

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "minimax-m3", "messages": [{"role":"user","content":"Hello"}]}'

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
temperatureNúmeroNão1Controla a aleatoriedade. Valores mais baixos são mais determinísticos; valores mais altos são mais exploratórios. · Intervalo: 0 – 2
top_pNúmeroNão0.95Controla a amostragem do núcleo limitando a geração à massa token mais provável. · Intervalo: 0 – 1
max_completion_tokensinteiroNão4096Token máximo gerado, incluindo tokens de raciocínio quando o pensamento está ativado. · Intervalo: 1 – 524288
stopArranjoNão-Sequência opcional de paradas ou lista de sequências de paradas.
enable_thinkingBooleanoNãoVerdadeAtive o pensamento adaptativo em modelos antes de responder. Defina false para pedir uma resposta direta sem uma fase de raciocínio.
web_search_linkupBooleanoNãofalsoPesquise na internet por informações recentes usando o Linkup antes das respostas do MiniMax M3. Adiciona $0.013 aos pedidos bem-sucedidos quando ativado.
toolsArranjoNão-Definições de ferramentas compatíveis com OpenAI para chamadas de funções.
tool_choiceObjetoNão-Opcional compatível com OpenAI tool_choice valor.

Notas

Entrada de texto, imagem e vídeo com saída de texto. O pensamento é adaptativo e pode ser desativado. A precificação é baseada em tokens de entrada, incluindo os acertos de cache: <=512K usa o nível padrão com desconto, enquanto >512K usa o nível de alto contexto. A rota padrão atual suporta até 524K tokens. O contexto do 1M está sendo implementado. A busca web do Linkup está disponível através do web_search_linkup e adiciona $0.013 por busca bem-sucedida.


Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/minimax-m3.