Kimi K2.7 Code

Kimi K2.7 Code
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.7 Code est le modèle de codage agent à un billion de paramètres de Moonshot avec un contexte 256K, un raisonnement toujours activé, ainsi que des entrées texte, image et vidéo.

En un coup d’œil

TerrainValeur
Identifiant de modèlekimi-k2-7-code
Date de sortie du modèle2026-06-16
Modalités d’entréeTexte, Image, Vidéo
Modalités de sortieTexte
Fenêtre de contexte256K
Précision du poids-
Jetons de sortie max131,072
Caractéristiquesraisonnement, function_calling, structured_output, multimodal, agentic_coding, web_search
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.95
Productionpar 1M de jetons générés$4.00
Recherche webpar appel lors de l’invocation$0.015

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-7-code", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
max_tokensNombrenon16384Jetons de sortie maximum. Les jetons de raisonnement comptent pour cette limite. · Répartition: 1 – 131072
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
response_formatObjetnon-Mode JSON compatible OpenAI ou format de réponse de schéma JSON.
tool_web_searchBooléennonfauxCherchez sur internet des informations en temps réel. Ajoute $0.015 au coût de la requête pour chaque appel de recherche web invoqué.

Notes

Prend en charge les entrées texte, image et vidéo avec 256K contexte, appels de fonction, sortie structurée en mode JSON et recherche web intégrée à $0.015 par appel invoqué. La pensée est toujours active et ne peut pas être désactivée; Les jetons de raisonnement sont présentés comme des jetons de sortie. Les dérogations de température et autres dérogations d’échantillonnage sont ignorées car le service de modèle utilise des réglages d’échantillonnage fixes. La fonction en plusieurs étapes appelant via l’API doit rejouer le message d’assistant avec son champ de reasoning_content intact.

Facturation par outil (usage.tool_usage)

Lorsque ce modèle invoque des outils intégrés à une seule requête, la réponse porte une carte de usage.tool_usage normalisée accompagnée des comptes de tokens. Le nombre d’outils est déjà pris en compte dans cost_usd et est mis en surface pour la transparence.

Variantes

:variant1

TerrainValeur
Identifiant de modèlekimi-k2-7-code:variant1
Date de sortie du modèle2026-06-16
RégionAllemagne
Fenêtre de contexte256K
Précision du poids-
Jetons de sortie max16,384
Caractéristiquesraisonnement, function_calling, structured_output, multimodal, agentic_coding, cache
Inférence autochtoneNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Prix

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.8939 (était $0.95)
Productionpar 1M de jetons générés$3.7131 (était $4.00)
Lecture implicite du cachepar 1M de jetons d’entrée mis en cache$0.1788

Paramètres

ParamètreTypeObligatoirePar défautDescription
max_tokensNombrenon16384Jetons de sortie maximum. Les jetons de raisonnement comptent pour cette limite. · Répartition: 1 – 16384
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
response_formatObjetnon-Mode JSON compatible OpenAI ou format de réponse de schéma JSON.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code.