Kimi K2.7 Code Highspeed

Kimi K2.7 Code Highspeed
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.7 Code Highspeed Moonshot के एजेंटिक कोडिंग मॉडल का तेज़-सेवा वाला स्तर है, जिसमें 256K संदर्भ, हमेशा चालू तर्क और छवि और वीडियो इनपुट है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीkimi-k2-7-code-highspeed
मॉडल रिलीज की तारीख2026-06-16
इनपुट तौर-तरीकेपाठ, छवि, वीडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो256 के
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन131,072
सुविधाऐंरीजनिंग, function_calling, structured_output, मल्टीमोडल, agentic_coding, web_search
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$1.90
उत्पादनप्रति 1M जेनरेट किए गए टोकन$8.00
वेब खोजप्रति कॉल जब लागू किया जाता है$0.015

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-7-code-highspeed", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
max_tokensसंख्यानहीं16384अधिकतम आउटपुट टोकन। रीजनिंग टोकन इस सीमा की ओर गिने जाते हैं। · रेंज: 1 - 131072
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
response_formatवस्तुनहीं-OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप।
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.015 जोड़ता है.

टिप्पणियाँ

Kimi K2.7 कोड का तेज़-सेवा वाला स्तर। 256K संदर्भ, फ़ंक्शन कॉलिंग, JSON मोड संरचित आउटपुट और $0.015 प्रति आह्वान कॉल पर अंतर्निहित वेब खोज के साथ पाठ, छवि और वीडियो इनपुट का समर्थन करता है। सोच हमेशा चालू रहती है और इसे अक्षम नहीं किया जा सकता है; रीजनिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है। तापमान और अन्य सैंपलिंग ओवरराइड को अनदेखा कर दिया जाता है क्योंकि मॉडल सेवा निश्चित सैंपलिंग सेटिंग्स का उपयोग करती है। एपीआई के माध्यम से कॉल करने वाले मल्टी-स्टेप फ़ंक्शन को सहायक संदेश को उसके reasoning_content फ़ील्ड के साथ फिर से चलाना चाहिए।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर अंतर्निहित टूल का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र को वहन करती है। टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं और पारदर्शिता के लिए सामने आए हैं।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code-highspeed