Fugu Ultra

Sakana AI · Text Generation
POST /v1/chat/completionsमल्टी-एजेंट कंडक्टर जो 1M संदर्भ, छवि इनपुट और वेब खोज के साथ कठिन तर्क, कोडिंग और अनुसंधान के लिए सीमांत विशेषज्ञ मॉडल का आयोजन करता है।
एक नजर में
मूल्य निर्धारण
उदाहरण अनुरोध
पैरामीटर
टिप्पणियाँ
Fugu Ultra एक बहु-एजेंट कंडक्टर है: प्रत्येक अनुरोध विशेषज्ञ मॉडल के एक पूल का समन्वय करता है और उनके काम को एक ही उत्तर में लिखता है।
विलंबता और स्ट्रीमिंग
- जटिल संकेतों पर प्रतिक्रियाओं में कुछ सेकंड से लेकर कुछ मिनट तक का समय लग सकता है।
- मॉडल समाप्त होने पर पूरा उत्तर एक ही बार में वापस कर दिया जाता है, टोकन द्वारा टोकन नहीं। स्ट्रीमिंग स्वीकार की जाती है, लेकिन यह टोकन को स्ट्रीमिंग करने के बजाय अंत में पूरी प्रतिक्रिया प्रदान करता है क्योंकि वे उत्पन्न होते हैं।
- उदार max_tokens हेडरूम छोड़ दें, क्योंकि बहुत छोटी सीमाएं उत्तर को छोटा या खाली कर सकती हैं।
क्षमताएं
- पाठ और छवि इनपुट, 1M टोकन संदर्भ के साथ।
- हमेशा तर्क पर। उच्च डिफ़ॉल्ट है; Xhigh और MAX एक ही अधिकतम प्रयास हैं।
- फ़ंक्शन कॉलिंग, JSON मोड, और अंतर्निहित वेब खोज जो उपलब्ध होने पर अपने स्रोतों का हवाला देती है (कोई अलग शुल्क नहीं)।
बिलिंग
- पूर्ण टोकन उपयोग पर बिल किया जाता है, जिसमें ऑर्केस्ट्रेशन टोकन भी शामिल है जो मॉडल आंतरिक रूप से उपयोग करता है, इसलिए छोटे संकेतों में भी कुछ लागत आती है।
- संदर्भ-स्तरीय: 272K कुल इनपुट टोकन से ऊपर के अनुरोध दिखाई गई उच्च दर का उपयोग करते हैं।
Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/fugu-ultra।
