Kimi K2.7 Code Highspeed | EmpirioLabs AI Docs

Moonshot AI · Text Generation

POST /v1/chat/completions

Kimi K2.7 Code Highspeed 是 Moonshot 代理编码模型中服务速度更快的版本，支持256K上下文、始终在线推理以及图像和视频输入。

一眼看

场地	价值
型号ID	`kimi-k2-7-code-highspeed`
车型发布日期	2026-06-16
输入模态	文本、图像、视频
输出模态	正文
上下文窗口	256K
重量精度	-
最大输出令牌	131,072
特色	推理、function_calling、structured_output、多模态、agentic_coding、web_search
本土推断	不
新	是的
支持的端点	`POST /v1/chat/completions`，`POST /v1/responses`，`POST /v1/messages`

定价

冲锋	规格	速率
输入	每100万个提示词标记	$1.90
输出	每100万个生成代币	$8.00
网络搜索	每次调用时	$0.015

示例请求

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数	类型	必修	默认	描述
`max_tokens`	人数	不	`16384`	最大输出令牌。推理代币计入此限额。·射程：1 – 131072
`stop`	弦	不	-	最多有4串字符串，模型会停止生成更多代币。
`response_format`	对象	不	-	兼容 OpenAI 的 JSON 模式或 JSON 模式响应格式。
`tool_web_search`	布尔值	不	错误	在网上搜索实时信息。每次调用的网络搜索调用的请求成本增加了$0.015。

注释

Kimi K2.7代码中更快的服务层。支持文本、图片和视频输入，支持256K上下文，函数调用，JSON模式结构化输出，以及每个调用$0.015的内置网页搜索。思维始终处于状态，无法被禁用;推理代币作为输出代币计费。温度和其他抽样覆盖被忽略，因为模型服务使用固定的采样设置。通过API调用多步函数，必须保持reasoning_content字段完整的助手消息。

按工具计费（usage.tool_usage）

当该模型在单一请求中调用内置工具时，响应会携带归一化后的usage.tool_usage映射，同时显示令牌计数。工具数量已经被纳入cost_usd并以表面显示以保证透明度。

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed。