Kimi K2.7 Code Highspeed

Kimi K2.7 Code Highspeed
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.7 Code Highspeed é a camada de serviço mais rápido do modelo de codificação agente da Moonshot, com contexto de 256K, raciocínio sempre ativo e entrada de imagem e vídeo.

De um olhar

CampoValor
ID do modelokimi-k2-7-code-highspeed
Data de lançamento do modelo2026-06-16
Modalidades de entradaTexto, Imagem, Vídeo
Modalidades de saídaTexto
Janela de contexto256K
Precisão do peso-
Tokens de saída máxima131,072
Característicasraciocínio, function_calling, structured_output, multimodal, agentic_coding, web_search
Inferência nativaNão
NovoSim
Endpoints suportadosPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Precificação

CargaEspecificaçãoTaxa
Entradapor 1M de tokens de prompt$1.90
Produçãopor 1M de tokens gerados$8.00
Busca na webpor chamada quando invocada$0.015

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
max_tokensNúmeroNão16384Tokens de saída máximos. Os tokens de raciocínio contam para esse limite. · Intervalo: 1 – 131072
stopStringNão-Até 4 strings em que o modelo para de gerar mais tokens.
response_formatObjetoNão-Modo JSON compatível com OpenAI ou formato de resposta de esquema JSON.
tool_web_searchBooleanoNãofalsoPesquise na internet por informações em tempo real. Adiciona $0.015 ao custo da solicitação para cada chamada de busca web invocada.

Notas

O nível de serviço mais rápido do Kimi K2.7 Code. Suporta entradas de texto, imagem e vídeo com contexto de 256K, chamada de funções, saída estruturada em modo JSON e busca web embutida a $0.015 por chamada invocada. O pensamento está sempre ligado e não pode ser desativado; tokens de raciocínio são anunciados como tokens de saída. Substituições de temperatura e outras amostragens são ignoradas porque o serviço de modelo usa configurações fixas de amostragem. A função multi-etapa que chama pela API deve reproduzir a mensagem assistente com seu campo de reasoning_content intacto.

Faturamento por ferramenta (usage.tool_usage)

Quando esse modelo invoca ferramentas embutidas dentro de uma única requisição, a resposta carrega um mapa de usage.tool_usage normalizado junto com as contagens de tokens. A contagem de ferramentas já está em conta na cost_usd e é apresentada para transparência.


Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed.