MiniMax M3

MiniMax · Text Generation

POST /v1/chat/completions

MiniMax M3 é um modelo de raciocínio multimodal para codificação, agentes e análise de longo contexto com entrada de texto, imagem e vídeo.

De um olhar

Campo	Valor
ID do modelo	`minimax-m3`
Data de lançamento do modelo	2026-06-01
Modalidades de entrada	Texto, Imagem, Vídeo
Modalidades de saída	Texto
Janela de contexto	524K
Precisão do peso	-
Tokens de saída máxima	524,288
Região	Singapura
Características	Raciocínio, visão, vídeo, web_search, function_calling, cache, long_context
Inferência nativa	Não
Novo	Sim
Endpoints suportados	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Precificação

Carga	Especificação	Taxa
Entrada	por 1M de tokens de prompt	<=512K $0.225 (era $0.30); >512K $1.20
Produção	por 1M de tokens gerados	<=512K $0.90 (era $1.20); >512K $4.80
Leitura implícita do cache	por 1M de tokens de entrada cacheados	<=512K $0.045 (era $0.06); >512K $0.24
Busca na web do Linkup	por busca bem-sucedida quando ativada	$0.013

Exemplo de pedido

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "minimax-m3", "messages": [{"role":"user","content":"Hello"}]}'

Parâmetros

Parâmetro	Tipo	Obrigatório	Padrão	Descrição
`temperature`	Número	Não	`1`	Controla a aleatoriedade. Valores mais baixos são mais determinísticos; valores mais altos são mais exploratórios. · Intervalo: 0 – 2
`top_p`	Número	Não	`0.95`	Controla a amostragem do núcleo limitando a geração à massa token mais provável. · Intervalo: 0 – 1
`max_completion_tokens`	inteiro	Não	`4096`	Token máximo gerado, incluindo tokens de raciocínio quando o pensamento está ativado. · Intervalo: 1 – 524288
`stop`	Arranjo	Não	-	Sequência opcional de paradas ou lista de sequências de paradas.
`enable_thinking`	Booleano	Não	Verdade	Ative o pensamento adaptativo em modelos antes de responder. Defina false para pedir uma resposta direta sem uma fase de raciocínio.
`web_search_linkup`	Booleano	Não	falso	Pesquise na internet por informações recentes usando o Linkup antes das respostas do MiniMax M3. Adiciona $0.013 aos pedidos bem-sucedidos quando ativado.
`tools`	Arranjo	Não	-	Definições de ferramentas compatíveis com OpenAI para chamadas de funções.
`tool_choice`	Objeto	Não	-	Opcional compatível com OpenAI tool_choice valor.

Notas

Entrada de texto, imagem e vídeo com saída de texto. O pensamento é adaptativo e pode ser desativado. A precificação é baseada em tokens de entrada, incluindo os acertos de cache: <=512K usa o nível padrão com desconto, enquanto >512K usa o nível de alto contexto. A rota padrão atual suporta até 524K tokens. O contexto do 1M está sendo implementado. A busca web do Linkup está disponível através do web_search_linkup e adiciona $0.013 por busca bem-sucedida.

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/minimax-m3.