Kimi K2.7 Code Highspeed | EmpirioLabs AI Docs

Moonshot AI · Text Generation

POST /v1/chat/completions

Kimi K2.7 Code Highspeed Moonshot के एजेंटिक कोडिंग मॉडल का तेज़-सेवा वाला स्तर है, जिसमें 256K संदर्भ, हमेशा चालू तर्क और छवि और वीडियो इनपुट है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`kimi-k2-7-code-highspeed`
मॉडल रिलीज की तारीख	2026-06-16
इनपुट तौर-तरीके	पाठ, छवि, वीडियो
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	256 के
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	131,072
सुविधाऐं	रीजनिंग, function_calling, structured_output, मल्टीमोडल, agentic_coding, web_search
मूल अनुमान	नहीं
नया	हाँ
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$1.90
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$8.00
वेब खोज	प्रति कॉल जब लागू किया जाता है	$0.015

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`max_tokens`	संख्या	नहीं	`16384`	अधिकतम आउटपुट टोकन। रीजनिंग टोकन इस सीमा की ओर गिने जाते हैं। · रेंज: 1 - 131072
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`response_format`	वस्तु	नहीं	-	OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप।
`tool_web_search`	बूलियन	नहीं	गलत	वास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.015 जोड़ता है.

Kimi K2.7 कोड का तेज़-सेवा वाला स्तर। 256K संदर्भ, फ़ंक्शन कॉलिंग, JSON मोड संरचित आउटपुट और $0.015 प्रति आह्वान कॉल पर अंतर्निहित वेब खोज के साथ पाठ, छवि और वीडियो इनपुट का समर्थन करता है। सोच हमेशा चालू रहती है और इसे अक्षम नहीं किया जा सकता है; रीजनिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है। तापमान और अन्य सैंपलिंग ओवरराइड को अनदेखा कर दिया जाता है क्योंकि मॉडल सेवा निश्चित सैंपलिंग सेटिंग्स का उपयोग करती है। एपीआई के माध्यम से कॉल करने वाले मल्टी-स्टेप फ़ंक्शन को सहायक संदेश को उसके reasoning_content फ़ील्ड के साथ फिर से चलाना चाहिए।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर अंतर्निहित टूल का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र को वहन करती है। टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं और पारदर्शिता के लिए सामने आए हैं।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ