Nova Pro 1.0

Nova Pro 1.0
Amazon · Text Generation
POST /v1/chat/completions

मल्टीमॉडल फाउंडेशन मॉडल 300K संदर्भ (~ 30 मिनट वीडियो तक) पर पाठ, छवियों और वीडियो के लिए सटीकता, गति और लागत को संतुलित करता है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीnova-pro-1-0
मॉडल रिलीज की तारीख2024-12-03
इनपुट तौर-तरीकेपाठ, छवि, वीडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो300 हजार
वजन परिशुद्धता-
अधिकतम आउटपुट टोकन5,000
सुविधाऐंदृष्टि
मूल अनुमाननहीं
नयानहीं
समर्थित समापन बिंदुPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

मूल्य निर्धारण

आवेशित करनायुक्तिदर
इनपुटप्रति 1M प्रॉम्प्ट टोकन$2.40
उत्पादनप्रति 1M जेनरेट किए गए टोकन$9.60
विलंबता अनुकूलित इनपुटप्रति 1M प्रॉम्प्ट टोकन$3.00
विलंबता अनुकूलित आउटपुटप्रति 1M जेनरेट किए गए टोकन$12.00
वेब खोज (Linkup)प्रति कॉल जब लागू किया जाता है$0.013

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "nova-pro-1-0", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
temperatureसंख्यानहीं0.7नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
top_pसंख्यानहीं0.9नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
max_tokensसंख्यानहीं4096प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 65536
stopतारनहीं-4 स्ट्रिंग्स तक जहां मॉडल आगे टोकन उत्पन्न करना बंद कर देगा।
latency_optimizedबूलियननहींगलतथोड़ी गुणवत्ता वाली लागत पर तेज़ रूटिंग पसंद करें।
enable_latency_optimizedबूलियननहींगलततेजी से प्रतिक्रियाओं के लिए विलंबता-अनुकूलित रूटिंग सक्षम करें, मानक दर के बजाय कैटलॉग विलंबता अनुकूलित दर (3.00इनपुट/3.00 इनपुट / 12.00 आउटपुट प्रति 1M टोकन) पर बिल किया गया।
web_search_linkupबूलियननहींगलतलिंकअप द्वारा संचालित वैकल्पिक वेब खोज। सक्षम होने पर, हाल के वेब स्रोतों को आपके नवीनतम उपयोगकर्ता संदेश को क्वेरी के रूप में उपयोग करके पुनर्प्राप्त किया जाता है और मॉडल को अतिरिक्त संदर्भ के रूप में प्रदान किया जाता है। मॉडल की सामान्य टोकन लागत के शीर्ष पर प्रति अनुरोध एक समान $0.013 जोड़ता है। डिफ़ॉल्ट रूप से अक्षम।
disable_formattingबूलियननहींगलतसक्षम होने पर, गेटवे वेब खोज Linkup उपयोग किए जाने वाले सहायक प्रतिक्रियाओं के लिए “स्रोत” पाद लेख नहीं जोड़ेगा। उपयोगी जब मॉडल आउटपुट को किसी अन्य सिस्टम में पाइप किया जाता है जो सजावट की उम्मीद नहीं करता है।

टिप्पणियाँ

उच्च लागत पर तेजी से प्रतिक्रियाओं के लिए वैकल्पिक विलंबता-अनुकूलित अनुमान।


Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/nova-pro-1-0