Kimi K2.7 Code | EmpirioLabs AI Docs

Moonshot AI · Text Generation

POST /v1/chat/completions

Kimi K2.7 Code 256K संदर्भ, हमेशा तर्क और पाठ, छवि और वीडियो इनपुट के साथ Moonshot का ट्रिलियन-पैरामीटर एजेंट कोडिंग मॉडल है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`kimi-k2-7-code`
मॉडल रिलीज की तारीख	2026-06-16
इनपुट तौर-तरीके	पाठ, छवि, वीडियो
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	256 के
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	131,072
सुविधाऐं	रीजनिंग, function_calling, structured_output, मल्टीमोडल, agentic_coding, web_search
मूल अनुमान	नहीं
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$0.95
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$4.00
वेब खोज	प्रति कॉल जब लागू किया जाता है	$0.015

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kimi-k2-7-code", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`max_tokens`	संख्या	नहीं	`16384`	अधिकतम आउटपुट टोकन। रीजनिंग टोकन इस सीमा की ओर गिने जाते हैं। · रेंज: 1 - 131072
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`response_format`	वस्तु	नहीं	-	OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप।
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.015 जोड़ता है.

256K संदर्भ, फ़ंक्शन कॉलिंग, JSON मोड संरचित आउटपुट और $0.015 प्रति आह्वान कॉल पर अंतर्निहित वेब खोज के साथ पाठ, छवि और वीडियो इनपुट का समर्थन करता है। सोच हमेशा चालू रहती है और इसे अक्षम नहीं किया जा सकता है; रीजनिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है। तापमान और अन्य सैंपलिंग ओवरराइड को अनदेखा कर दिया जाता है क्योंकि मॉडल सेवा निश्चित सैंपलिंग सेटिंग्स का उपयोग करती है। एपीआई के माध्यम से कॉल करने वाले मल्टी-स्टेप फ़ंक्शन को सहायक संदेश को उसके reasoning_content फ़ील्ड के साथ फिर से चलाना चाहिए।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर अंतर्निहित टूल का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र को वहन करती है। टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं और पारदर्शिता के लिए सामने आए हैं।

विकल्प

`:variant1`

फ़ील्ड	मूल्य
मॉडल आईडी	`kimi-k2-7-code:variant1`
मॉडल रिलीज की तारीख	2026-06-16
क्षेत्र	जर्मनी
संदर्भ विंडो	256 के
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	16,384
सुविधाऐं	रीजनिंग, function_calling, structured_output, मल्टीमोडल, agentic_coding, कैश
मूल अनुमान	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$0.8939 ($0.95 था)
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$3.7131 ($4.00 था)
अंतर्निहित कैश पढ़ा गया	प्रति 1M कैश्ड इनपुट टोकन	$0.1788

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`max_tokens`	संख्या	नहीं	`16384`	अधिकतम आउटपुट टोकन। रीजनिंग टोकन इस सीमा की ओर गिने जाते हैं। · रेंज: 1 - 16384
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`response_format`	वस्तु	नहीं	-	OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code।