Kimi K2.7 Code

Kimi K2.7 Code
Moonshot AI · Text Generation
POST /v1/chat/completions

Kimi K2.7 Code 256K संदर्भ, हमेशा तर्क और पाठ, छवि और वीडियो इनपुट के साथ Moonshot का ट्रिलियन-पैरामीटर एजेंट कोडिंग मॉडल है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीkimi-k2-7-code
मॉडल रिलीज की तारीख2026-06-16
इनपुट तौर-तरीकेपाठ, छवि, वीडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो256 के
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन131,072
सुविधाऐंरीजनिंग, function_calling, structured_output, मल्टीमोडल, agentic_coding, web_search
मूल अनुमाननहीं
नयाहाँ
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.95
उत्पादनप्रति 1M जेनरेट किए गए टोकन$4.00
वेब खोजप्रति कॉल जब लागू किया जाता है$0.015

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kimi-k2-7-code", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
max_tokensसंख्यानहीं16384अधिकतम आउटपुट टोकन। रीजनिंग टोकन इस सीमा की ओर गिने जाते हैं। · रेंज: 1 - 131072
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
response_formatवस्तुनहीं-OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप।
tool_web_searchबूलियननहींगलतवास्तविक समय की जानकारी के लिए वेब पर खोजें। प्रत्येक आह्वान किए गए वेब खोज कॉल के लिए अनुरोध लागत में $0.015 जोड़ता है.

टिप्पणियाँ

256K संदर्भ, फ़ंक्शन कॉलिंग, JSON मोड संरचित आउटपुट और $0.015 प्रति आह्वान कॉल पर अंतर्निहित वेब खोज के साथ पाठ, छवि और वीडियो इनपुट का समर्थन करता है। सोच हमेशा चालू रहती है और इसे अक्षम नहीं किया जा सकता है; रीजनिंग टोकन को आउटपुट टोकन के रूप में बिल किया जाता है। तापमान और अन्य सैंपलिंग ओवरराइड को अनदेखा कर दिया जाता है क्योंकि मॉडल सेवा निश्चित सैंपलिंग सेटिंग्स का उपयोग करती है। एपीआई के माध्यम से कॉल करने वाले मल्टी-स्टेप फ़ंक्शन को सहायक संदेश को उसके reasoning_content फ़ील्ड के साथ फिर से चलाना चाहिए।

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर अंतर्निहित टूल का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र को वहन करती है। टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं और पारदर्शिता के लिए सामने आए हैं।

विकल्प

:variant1

फ़ील्डमूल्य
मॉडल आईडीkimi-k2-7-code:variant1
मॉडल रिलीज की तारीख2026-06-16
क्षेत्रजर्मनी
संदर्भ विंडो256 के
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन16,384
सुविधाऐंरीजनिंग, function_calling, structured_output, मल्टीमोडल, agentic_coding, कैश
मूल अनुमाननहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$0.8939 ($0.95 था)
उत्पादनप्रति 1M जेनरेट किए गए टोकन$3.7131 ($4.00 था)
अंतर्निहित कैश पढ़ा गयाप्रति 1M कैश्ड इनपुट टोकन$0.1788

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
max_tokensसंख्यानहीं16384अधिकतम आउटपुट टोकन। रीजनिंग टोकन इस सीमा की ओर गिने जाते हैं। · रेंज: 1 - 16384
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
response_formatवस्तुनहीं-OpenAI-संगत JSON मोड या JSON स्कीमा प्रतिक्रिया प्रारूप।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/kimi-k2-7-code