Gemma 4 E4B | EmpirioLabs AI Docs

Google · Text Generation

POST /v1/chat/completions

Gemma 4 E4B छवि इनपुट, फ़ंक्शन कॉलिंग, संरचित आउटपुट और कुशल निर्देश निम्नलिखित के साथ एक Google खुला मल्टीमॉडल चैट मॉडल है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`gemma-4-e4b`
मॉडल रिलीज की तारीख	2026-03-31
इनपुट तौर-तरीके	पाठ, छवि
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	8K
वजन परिशुद्धता	AWQ 4-बिट
अधिकतम आउटपुट टोकन	4,096
सुविधाऐं	दृष्टि, function_calling, structured_output, तर्क
मूल अनुमान	हाँ
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
प्रति संदेश	स्‍थायी	$0.03
वेब खोज (Linkup)	प्रति कॉल जब लागू किया जाता है	$0.013

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। कम मान अधिक नियतात्मक होते हैं। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.95`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। · रेंज: 0 - 1
`min_p`	संख्या	नहीं	`0`	न्यूनतम टोकन संभाव्यता फ़िल्टर। · रेंज: 0 - 1
`max_tokens`	पूर्ण संख्‍या	नहीं	`4096`	अधिकतम आउटपुट टोकन। · रेंज: 1 - 4096
`stop`	तार	नहीं	-	एक या अधिक स्टॉप स्ट्रिंग्स।
`seed`	पूर्ण संख्‍या	नहीं	-	वैकल्पिक नियतात्मक नमूना बीज। · रेंज: 0 - 2147483647
`enable_thinking`	बूलियन	नहीं	सच	अंतिम आउटपुट से पहले मॉडल रीजनिंग चैनल को सक्षम करें।
`reasoning_effort`	एनम	नहीं	-	OpenAI-संगत संकेत। मध्यम और उच्च सक्षम सोच मोड। · अनुमति: `low`, `medium`, `high`
`presence_penalty`	संख्या	नहीं	`0`	पहले से दिखाई देने वाले टोकन को दंडित करें। · रेंज: -2 - 2
`frequency_penalty`	संख्या	नहीं	`0`	बार-बार टोकन को आवृत्ति के आधार पर दंडित करें। · रेंज: -2 - 2
`repetition_penalty`	संख्या	नहीं	`1`	सटीक दोहराए गए पाठ को हतोत्साहित करें। · रेंज: 0.1 - 2
`logprobs`	बूलियन	नहीं	गलत	समर्थित होने पर टोकन लॉग संभावनाएँ लौटाएँ।
`top_logprobs`	पूर्ण संख्‍या	नहीं	-	लौटने के लिए वैकल्पिक टोकन लॉग संभावनाओं की संख्या। · रेंज: 0 - 20
`tools`	सरणी	नहीं	-	OpenAI-संगत फ़ंक्शन टूल परिभाषाएँ।
`tool_choice`	वस्तु	नहीं	-	OpenAI-संगत फ़ंक्शन टूल चयन।
`response_format`	वस्तु	नहीं	-	संरचित JSON आउटपुट निर्देश।
`stream`	बूलियन	नहीं	गलत	सर्वर द्वारा भेजे गए ईवेंट का उपयोग करके प्रतिक्रिया डेल्टा स्ट्रीम करें।
`web_search_linkup`	बूलियन	नहीं	गलत	लिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
`disable_formatting`	बूलियन	नहीं	गलत	सक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

डिफ़ॉल्ट रूप से पाठ और छवि इनपुट, स्ट्रीमिंग, फ़ंक्शन टूल, संरचित JSON आउटपुट, बीज नियंत्रण और सोच मोड का समर्थन करता है। बिलिंग प्रति सफल संदेश है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ