Kimi K2.6

Kimi K2.6
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.6 est un modèle de raisonnement multimodal Moonshot avec un contexte 256K, un codage fort, ainsi que des entrées texte, image et vidéo.

En un coup d’œil

TerrainValeur
Identifiant de modèlekimi-k2-6
Date de sortie du modèle2026-04-20
Modalités d’entréeTexte, Image, Vidéo
Modalités de sortieTexte
Fenêtre de contexte256K
Précision du poids-
Jetons de sortie max16,000
RégionChine
Caractéristiquesraisonnement, function_calling, cache, multimodal
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.8939 (était $0.95)
Productionpar 1M de jetons générés$3.7131 (était $4.00)
Lecture implicite du cachepar 1M de jetons d’entrée mis en cache$0.1788
Recherche Web (Linkup)par appel lors de l’invocation$0.013

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-6", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1
max_tokensNombrenon4096Jetons de sortie maximum. · Répartition: 1 – 16000
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_thinkingBooléennonVraiActivez le raisonnement avant de répondre.
thinking_budgetNombrenon32768Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 81920
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max
web_search_linkupBooléennonfauxRecherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
disable_formattingBooléennonfauxUne fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/kimi-k2-6.