Gemma 4 E4B

Gemma 4 E4B
Google · Text Generation
POST /v1/chat/completions

Gemma 4 E4B छवि इनपुट, फ़ंक्शन कॉलिंग, संरचित आउटपुट और कुशल निर्देश निम्नलिखित के साथ एक Google खुला मल्टीमॉडल चैट मॉडल है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीgemma-4-e4b
मॉडल रिलीज की तारीख2026-03-31
इनपुट तौर-तरीकेपाठ, छवि
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो8K
वजन परिशुद्धताAWQ 4-बिट
अधिकतम आउटपुट टोकन4,096
सुविधाऐंदृष्टि, function_calling, structured_output, तर्क
मूल अनुमानहाँ
नयानहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
प्रति संदेशस्‍थायी$0.03
वेब खोज (Linkup)प्रति कॉल जब लागू किया जाता है$0.013

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "gemma-4-e4b", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। कम मान अधिक नियतात्मक होते हैं। · रेंज: 0 - 2
top_pसंख्यानहीं0.95नाभिक नमूनाकरण संभाव्यता द्रव्यमान। · रेंज: 0 - 1
min_pसंख्यानहीं0न्यूनतम टोकन संभाव्यता फ़िल्टर। · रेंज: 0 - 1
max_tokensपूर्ण संख्‍यानहीं4096अधिकतम आउटपुट टोकन। · रेंज: 1 - 4096
stopतारनहीं-एक या अधिक स्टॉप स्ट्रिंग्स।
seedपूर्ण संख्‍यानहीं-वैकल्पिक नियतात्मक नमूना बीज। · रेंज: 0 - 2147483647
enable_thinkingबूलियननहींसचअंतिम आउटपुट से पहले मॉडल रीजनिंग चैनल को सक्षम करें।
reasoning_effortएनमनहीं-OpenAI-संगत संकेत। मध्यम और उच्च सक्षम सोच मोड। · अनुमति: low, medium, high
presence_penaltyसंख्यानहीं0पहले से दिखाई देने वाले टोकन को दंडित करें। · रेंज: -2 - 2
frequency_penaltyसंख्यानहीं0बार-बार टोकन को आवृत्ति के आधार पर दंडित करें। · रेंज: -2 - 2
repetition_penaltyसंख्यानहीं1सटीक दोहराए गए पाठ को हतोत्साहित करें। · रेंज: 0.1 - 2
logprobsबूलियननहींगलतसमर्थित होने पर टोकन लॉग संभावनाएँ लौटाएँ।
top_logprobsपूर्ण संख्‍यानहीं-लौटने के लिए वैकल्पिक टोकन लॉग संभावनाओं की संख्या। · रेंज: 0 - 20
toolsसरणीनहीं-OpenAI-संगत फ़ंक्शन टूल परिभाषाएँ।
tool_choiceवस्तुनहीं-OpenAI-संगत फ़ंक्शन टूल चयन।
response_formatवस्तुनहीं-संरचित JSON आउटपुट निर्देश।
streamबूलियननहींगलतसर्वर द्वारा भेजे गए ईवेंट का उपयोग करके प्रतिक्रिया डेल्टा स्ट्रीम करें।
web_search_linkupबूलियननहींगलतलिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
disable_formattingबूलियननहींगलतसक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

टिप्पणियाँ

डिफ़ॉल्ट रूप से पाठ और छवि इनपुट, स्ट्रीमिंग, फ़ंक्शन टूल, संरचित JSON आउटपुट, बीज नियंत्रण और सोच मोड का समर्थन करता है। बिलिंग प्रति सफल संदेश है।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/gemma-4-e4b