Kimi K2.7 Code Highspeed

POST /v1/chat/completionsKimi K2.7 Code Highspeed est la couche de service plus rapide du modèle de codage agent de Moonshot, avec un contexte 256K, un raisonnement toujours activé, ainsi que des entrées image et vidéo.
En un coup d’œil
Tarification
Exemple de demande
Paramètres
Notes
Le niveau de service plus rapide du code Kimi K2.7. Prend en charge les entrées texte, image et vidéo avec 256K contexte, appels de fonction, sortie structurée en mode JSON et recherche web intégrée à $0.015 par appel invoqué. La pensée est toujours active et ne peut pas être désactivée; Les jetons de raisonnement sont présentés comme des jetons de sortie. Les dérogations de température et autres dérogations d’échantillonnage sont ignorées car le service de modèle utilise des réglages d’échantillonnage fixes. La fonction en plusieurs étapes appelant via l’API doit rejouer le message d’assistant avec son champ de reasoning_content intact.
Facturation par outil (usage.tool_usage)
Lorsque ce modèle invoque des outils intégrés à une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de tokens. Le nombre d’outils est déjà pris en compte dans cost_usd et est mis en surface pour la transparence.
_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed.
