Nova Pro 1.0 | EmpirioLabs AI Docs

Amazon · Text Generation

POST /v1/chat/completions

मल्टीमॉडल फाउंडेशन मॉडल 300K संदर्भ (~ 30 मिनट वीडियो तक) पर पाठ, छवियों और वीडियो के लिए सटीकता, गति और लागत को संतुलित करता है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`nova-pro-1-0`
मॉडल रिलीज की तारीख	2024-12-03
इनपुट तौर-तरीके	पाठ, छवि, वीडियो
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	300 हजार
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	5,000
सुविधाऐं	दृष्टि
मूल अनुमान	नहीं
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$2.40
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	$9.60
विलंबता अनुकूलित इनपुट	प्रति 1M प्रॉम्प्ट टोकन	$3.00
विलंबता अनुकूलित आउटपुट	प्रति 1M जेनरेट किए गए टोकन	$12.00
वेब खोज (Linkup)	प्रति कॉल जब लागू किया जाता है	$0.013

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "nova-pro-1-0", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 65536
`stop`	तार	नहीं	-	4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
`latency_optimized`	बूलियन	नहीं	गलत	थोड़ी गुणवत्ता वाली लागत पर तेज़ रूटिंग पसंद करें।
`enable_latency_optimized`	बूलियन	नहीं	गलत	तेजी से प्रतिक्रियाओं के लिए विलंबता-अनुकूलित रूटिंग सक्षम करें, मानक दर के बजाय कैटलॉग विलंबता अनुकूलित दर ( $3.00 इनपुट /$ 12.00 आउटपुट प्रति 1M टोकन) पर बिल किया गया।
`web_search_linkup`	बूलियन	नहीं	गलत	लिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
`disable_formatting`	बूलियन	नहीं	गलत	सक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ