Kimi K2.7 Code

Kimi K2.7 Code
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.7 Code ist Moonshots agentisches Codierungsmodell mit Billionen Parametern und 256K-Kontext, ständigem Denken sowie Text-, Bild- und Videoeingaben.

Auf einen Blick

SpielfeldWert
Modell-IDkimi-k2-7-code
Modell-Veröffentlichungsdatum2026-06-16
EingabemodalitätenText, Bild, Video
AusgabemodalitätenText
Kontextfenster256.000
Gewichtspräzision-
Maximale Ausgabetoken131,072
MerkmaleVernunft, function_calling, structured_output, Multimodal, agentic_coding, web_search
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$0.95
Ausgabepro 1 Million generierter Token$4.00
Websuchepro Aufruf beim Aufruf$0.015

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-7-code", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
max_tokensAnzahlNein16384Maximale Ausgabe-Token. Reasoning-Tokens zählen zu diesem Limit. · Reichweite: 1 – 131072
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
response_formatGegenstandNein-OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat.
tool_web_searchBooleanNeinfalschSuchen Sie im Internet nach Echtzeitinformationen. Fügt $0.015 die Anfragekosten für jeden aufgerufenen Websuchaufruf hinzu.

Anmerkungen

Unterstützt Text-, Bild- und Videoeingaben mit 256K-Kontext, Funktionsaufruf, strukturierter Ausgabe im JSON-Modus und integrierte Websuche bei $0.015 pro aufgerufenem Aufruf. Das Denken ist immer aktiviert und kann nicht deaktiviert werden; Reasoning Tokens werden als Ausgabetoken abgerechnet. Temperatur- und andere Stichprobenüberschreibungen werden ignoriert, da der Modelldienst feste Abtasteinstellungen verwendet. Mehrschrittige Funktionsaufrufe über die API müssen die Assistant-Nachricht mit ihrem reasoning_content Feld erneut abspielen.

Pro-Werkzeug-Abrechnung (usage.tool_usage)

Wenn dieses Modell in einer einzigen Anfrage eingebaute Werkzeuge aufruft, trägt die Antwort eine normalisierte usage.tool_usage Map neben den Token-Zählungen. Die Werkzeuganzahl wird bereits in cost_usd einbezogen und zur Transparenz angezeigt.

Varianten

:variant1

SpielfeldWert
Modell-IDkimi-k2-7-code:variant1
Modell-Veröffentlichungsdatum2026-06-16
RegionDeutschland
Kontextfenster256.000
Gewichtspräzision-
Maximale Ausgabetoken16,384
MerkmaleReasoning, function_calling, structured_output, Multimodal, agentic_coding, Cache
Native SchlussfolgerungNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$0.8939 (war $0.95)
Ausgabepro 1 Million generierter Token$3.7131 (war $4.00)
Implizite Cache-Leseartpro 1M zwischengespeicherten Eingabetoken$0.1788

Parameter

ParameterTypErforderlichDefaultBeschreibung
max_tokensAnzahlNein16384Maximale Ausgabe-Token. Reasoning-Tokens zählen zu diesem Limit. · Entfernung: 1 – 16384
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
response_formatGegenstandNein-OpenAI-kompatibler JSON-Modus oder JSON-Schema-Antwortformat.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code.