Kimi K2.7 Code Highspeed | EmpirioLabs AI Docs

Moonshot AI · Text Generation

POST /v1/chat/completions

Kimi K2.7 Code Highspeed est la couche de service plus rapide du modèle de codage agent de Moonshot, avec un contexte 256K, un raisonnement toujours activé, ainsi que des entrées image et vidéo.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`kimi-k2-7-code-highspeed`
Date de sortie du modèle	2026-06-16
Modalités d’entrée	Texte, Image, Vidéo
Modalités de sortie	Texte
Fenêtre de contexte	256K
Précision du poids	-
Jetons de sortie max	131,072
Caractéristiques	raisonnement, function_calling, structured_output, multimodal, agentic_coding, web_search
Inférence autochtone	Non
Nouveau	Oui
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	$1.90
Production	par 1M de jetons générés	$8.00
Recherche web	par appel lors de l’invocation	$0.015

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`max_tokens`	Nombre	non	`16384`	Jetons de sortie maximum. Les jetons de raisonnement comptent pour cette limite. · Répartition: 1 – 131072
`stop`	Corde	non	-	Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
`response_format`	Objet	non	-	Mode JSON compatible OpenAI ou format de réponse de schéma JSON.
`tool_web_search`	Booléen	non	faux	Cherchez sur internet des informations en temps réel. Ajoute $0.015 au coût de la requête pour chaque appel de recherche web invoqué.

Notes

Le niveau de service plus rapide du code Kimi K2.7. Prend en charge les entrées texte, image et vidéo avec 256K contexte, appels de fonction, sortie structurée en mode JSON et recherche web intégrée à $0.015 par appel invoqué. La pensée est toujours active et ne peut pas être désactivée; Les jetons de raisonnement sont présentés comme des jetons de sortie. Les dérogations de température et autres dérogations d’échantillonnage sont ignorées car le service de modèle utilise des réglages d’échantillonnage fixes. La fonction en plusieurs étapes appelant via l’API doit rejouer le message d’assistant avec son champ de reasoning_content intact.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils intégrés à une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de tokens. Le nombre d’outils est déjà pris en compte dans cost_usd et est mis en surface pour la transparence.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed.