Kimi K2.7 Code Highspeed

Moonshot AI · Text Generation

POST /v1/chat/completions

Kimi K2.7 Code Highspeedは、Moonshotのエージェントコーディングモデルの中でより高速なサービング層で、256Kのコンテキスト、常時オンの推論、画像および映像入力を備えています。

一目で

フィールド	価値
モデルID	`kimi-k2-7-code-highspeed`
モデル発売日	2026-06-16
入力モダリティ	テキスト、画像、ビデオ
出力モダリティ	本文
コンテキストウィンドウ	256K
重量精度	-
最大出力トークン	131,072
特徴	推論、function_calling、structured_output、マルチモーダル、agentic_coding、web_search
ネイティブ推論	いいえ
新作	はい
サポート端末	`POST /v1/chat/completions`、`POST /v1/responses`、`POST /v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	$1.90
出力	生成された1Mトークンあたり	$8.00
ウェブ検索	呼び出し時の通話ごと	$0.015

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`max_tokens`	番号	いいえ	`16384`	最大出力トークン。推論トークンもこの制限にカウントされます。·射程:1 – 131072
`stop`	ストリング	いいえ	-	最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
`response_format`	目的	いいえ	-	OpenAI互換JSONモードまたはJSONスキーマ応答形式。
`tool_web_search`	ブール値	いいえ	偽り	リアルタイムの情報をウェブで検索しましょう。呼び出すウェブ検索コールごとにリクエストコストが$0.015増加します。

注記

Kimi K2.7コードのより速い供給層。テキスト、画像、ビデオ入力をサポートし、256Kのコンテキスト、関数呼び出し、JSONモードの構造化出力、呼び出しごとに$0.015の組み込みウェブ検索機能。思考は常にオンで、無効化されることはありません。推論トークンは出力トークンとして課金されます。温度やその他のサンプリングオーバーライドは無視されます。モデルサービスは固定されたサンプリング設定を使用しているためです。APIを通じた多段階関数呼び出しは、reasoning_contentフィールドを保持したままアシスタントメッセージを再生しなければなりません。

ツールごとの請求(usage.tool_usage)

このモデルが単一のリクエスト内で組み込みツールを呼び出す場合、レスポンスはトークン数とともに正規化されたusage.tool_usageマップを伴います。工具数はすでに計入されており、透明性を保つために表面化されていますcost_usd。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed。