Kimi K2.6

Kimi K2.6
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.6 是一个 Moonshot 多模态推理模型,拥有 256K 上下文、强编码以及文本、图像和视频输入。

一眼看

场地价值
型号IDkimi-k2-6
车型发布日期2026-04-20
输入模态文本、图像、视频
输出模态正文
上下文窗口256K
重量精度-
最大输出令牌16,000
地区中国
特色推理、逻辑、function_calling、缓存、多模态
本土推断
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记$0.8939(曾经$0.95)
输出每100万个生成代币$3.7131(曾经$4.00)
隐式缓存读取每 1M 缓存输入标记$0.1788
网页搜索(Linkup)每次调用时$0.013

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-6", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度。0 = 确定性,2 = 最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。较低的数值使输出更集中。·射程:0 – 1
max_tokens人数4096最大输出令牌。·范围:1 – 16000
stop-最多有4串字符串,模型会停止生成更多代币。
enable_thinking布尔值确实如此在回答之前先启用推理。
thinking_budget人数32768开启了思考时保留给推理的最大代币。·范围:1 – 81920
reasoning_effort枚举"medium"推理努力程度。没有人能让思考失效。低、中、高和最大设定了根据所选模型大小的有界思维预算。以类似OpenAI的 reasoning_effort 字段形式发送,转换为模型服务的enable_thinking和thinking_budget。·允许:nonelowmediumhighmax
web_search_linkup布尔值错误可选的网页搜索由Linkup提供。启用后,最近的网页源会通过最新的用户消息作为查询检索,并作为额外上下文提供给模型。在模型正常的代币成本基础上,每个请求都增加了固定$0.013。默认为禁用。
disable_formatting布尔值错误启用后,网关不会在使用Linkup网页搜索的助理响应中附加“来源”脚部。当模型输出被传输到另一个不需要装饰的系统时,这很有用。

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/kimi-k2-6