Kimi K2.7 Code | EmpirioLabs AI Docs

Moonshot AI · Text Generation

POST /v1/chat/completions

Kimi K2.7 Code ist Moonshots agentisches Codierungsmodell mit Billionen Parametern und 256K-Kontext, ständigem Denken sowie Text-, Bild- und Videoeingaben.

Auf einen Blick

Spielfeld	Wert
Modell-ID	`kimi-k2-7-code`
Modell-Veröffentlichungsdatum	2026-06-16
Eingabemodalitäten	Text, Bild, Video
Ausgabemodalitäten	Text
Kontextfenster	256.000
Gewichtspräzision	-
Maximale Ausgabetoken	131,072
Merkmale	Vernunft, function_calling, structured_output, Multimodal, agentic_coding, web_search
Native Schlussfolgerung	Nein
Neu	Ja
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$0.95
Ausgabe	pro 1 Million generierter Token	$4.00
Websuche	pro Aufruf beim Aufruf	$0.015

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kimi-k2-7-code", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`max_tokens`	Anzahl	Nein	`16384`	Maximale Ausgabe-Token. Reasoning-Tokens zählen zu diesem Limit. · Reichweite: 1 – 131072
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`response_format`	Gegenstand	Nein	-	OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat.
`tool_web_search`	Boolean	Nein	falsch	Suchen Sie im Internet nach Echtzeitinformationen. Fügt $0.015 die Anfragekosten für jeden aufgerufenen Websuchaufruf hinzu.

Anmerkungen

Unterstützt Text-, Bild- und Videoeingaben mit 256K-Kontext, Funktionsaufruf, strukturierter Ausgabe im JSON-Modus und integrierte Websuche bei $0.015 pro aufgerufenem Aufruf. Das Denken ist immer aktiviert und kann nicht deaktiviert werden; Reasoning Tokens werden als Ausgabetoken abgerechnet. Temperatur- und andere Stichprobenüberschreibungen werden ignoriert, da der Modelldienst feste Abtasteinstellungen verwendet. Mehrschrittige Funktionsaufrufe über die API müssen die Assistant-Nachricht mit ihrem reasoning_content Feld erneut abspielen.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell in einer einzigen Anfrage eingebaute Werkzeuge aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Die Werkzeuganzahl wird bereits in cost_usd einbezogen und zur Transparenz angezeigt.

Varianten

`:variant1`

Spielfeld	Wert
Modell-ID	`kimi-k2-7-code:variant1`
Modell-Veröffentlichungsdatum	2026-06-16
Region	Deutschland
Kontextfenster	256.000
Gewichtspräzision	-
Maximale Ausgabetoken	16,384
Merkmale	Reasoning, function_calling, structured_output, Multimodal, agentic_coding, Cache
Native Schlussfolgerung	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$0.8939 (war $0.95)
Ausgabe	pro 1 Million generierter Token	$3.7131 (war $4.00)
Implizite Cache-Leseart	pro 1M zwischengespeicherten Eingabetoken	$0.1788

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`max_tokens`	Anzahl	Nein	`16384`	Maximale Ausgabe-Token. Reasoning-Tokens zählen zu diesem Limit. · Entfernung: 1 – 16384
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`response_format`	Gegenstand	Nein	-	OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code.