Kimi K2.7 Code Highspeed

POST /v1/chat/completionsKimi K2.7 Code Highspeed es la capa de servicio más rápido del modelo de codificación agente de Moonshot, con contexto de 256K, razonamiento siempre activado y entrada de imagen y vídeo.
A simple vista
Precios
Solicitud de ejemplo
Parámetros
Notas
El nivel de servicio más rápido del código Kimi K2.7. Soporta entradas de texto, imagen y vídeo con contexto de 256K, llamada a funciones, salida estructurada en modo JSON y búsqueda web integrada a $0.015 por llamada invocada. El pensamiento está siempre activo y no puede ser deshabilitado; Los tokens de razonamiento se presentan como tokens de salida. Se ignoran las anulaciones de temperatura y otras sustituciones de muestreo porque el servicio de modelos utiliza ajustes de muestreo fijos. La función multi-step que llama a través de la API debe reproducir el mensaje de asistente con su campo de reasoning_content intacto.
Facturación por herramienta (usage.tool_usage)
Cuando este modelo invoca herramientas integradas dentro de una sola petición, la respuesta lleva un mapa de usage.tool_usage normalizado junto a los recuentos de tokens. El número de herramientas ya está incluido en cost_usd y se presenta para mayor transparencia.
Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed.
