Kimi K2.7 Code Highspeed

Kimi K2.7 Code Highspeed
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.7 Code Highspeedは、Moonshotのエージェントコーディングモデルの中でより高速なサービング層で、256Kのコンテキスト、常時オンの推論、画像および映像入力を備えています。

一目で

フィールド価値
モデルIDkimi-k2-7-code-highspeed
モデル発売日2026-06-16
入力モダリティテキスト、画像、ビデオ
出力モダリティ本文
コンテキストウィンドウ256K
重量精度-
最大出力トークン131,072
特徴推論、function_calling、structured_output、マルチモーダル、agentic_coding、web_search
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$1.90
出力生成された1Mトークンあたり$8.00
ウェブ検索呼び出し時の通話ごと$0.015

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
max_tokens番号いいえ16384最大出力トークン。推論トークンもこの制限にカウントされます。·射程:1 – 131072
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
response_format目的いいえ-OpenAI互換JSONモードまたはJSONスキーマ応答形式。
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。呼び出すウェブ検索コールごとにリクエストコストが$0.015増加します。

注記

Kimi K2.7コードのより速い供給層。テキスト、画像、ビデオ入力をサポートし、256Kのコンテキスト、関数呼び出し、JSONモードの構造化出力、呼び出しごとに$0.015の組み込みウェブ検索機能。思考は常にオンで、無効化されることはありません。推論トークンは出力トークンとして課金されます。温度やその他のサンプリングオーバーライドは無視されます。モデルサービスは固定されたサンプリング設定を使用しているためです。APIを通じた多段階関数呼び出しは、reasoning_contentフィールドを保持したままアシスタントメッセージを再生しなければなりません。

ツールごとの請求(usage.tool_usage)

このモデルが単一のリクエスト内で組み込みツールを呼び出す場合、レスポンスはトークン数とともに正規化されたusage.tool_usageマップを伴います。工具数はすでに計入されており、透明性を保つために表面化されていますcost_usd


Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed