Fugu Ultra

Fugu Ultra
Sakana AI · Text Generation
POST /v1/chat/completions

قائد موسيقي متعدد الوكلاء ينسق نماذج خبراء رائدة للاستدلال القوي، والترميز، والبحث، مع 1M سياق، وإدخال صور، وبحث على الويب.

في لمحة

الميدانالقيمة
النموذجfugu-ultra
تاريخ الإفراج النموذجي2026-06-21
طرائق المدخلاتالنص، الصورة
طرائق النواتجالنص
نافذة السياق1M
دقة الوزن-
الحد الأقصى للنواتج131,072
المعالمالمنطق، متعدد الوسائط، web_search، function_calling، structured_output، agentic_coding، ذاكرة تخزين مؤقت
Native inferenceلا
جديدةنعم
نقاط النهاية المدعومةPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

الطباعة

الرسمSpecالمعدل
الناتج1M<=272K $7.50; >272K $15.00
الناتج1M المولدة<=272K $45.00; >272K $67.50
يُقرأ المخبأ1M cached input tokens<=272K $1.50; >272K $3.00

طلب مثال

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
max_tokensintegerلا32768الحد الأقصى لعدد رموز الإخراج للإجابة النهائية. يحتاج الموصل إلى مساحة للعمل، لذا يمكن لقيم صغيرة جدا أن تعيد مخرجا فارغا. · النطاق: 1 – 131072
reasoning_effortenumلا"high"كم هو صعب Fugu Ultra الأسباب. المنطق دائما موجود. الافتراضي مرتفع؛ Xhigh وMax هما أسماء مستعارة لنفس الجهد الأقصى (أكثر شمولا وأبطأ من العالية). · مسموح به: high، xhigh، max
tool_web_searchbooleanلاكاذبفعل البحث المدمج على الويب. لا توجد رسوم منفصلة؛ تنعكس تكلفة البحث في رموز التنسيق التي يتم فوترتها للطلب.
toolsصفائفلا[]OpenAI-compatible function calling tool definitions.
tool_choiceالجسملا-التحكم في اختيار الأدوات المتوافقة
response_formatالجسملا-وضع JSON متوافق مع OpenAI للمخرجات المنظمة.

الحواشي

Fugu Ultra هو موصل متعدد الوكلاء: كل طلب ينسق مجموعة من نماذج الخبراء ويجمع عملهم في إجابة واحدة.

التأخير والبث

  • قد تستغرق الردود من بضع ثوان إلى بضع دقائق في المحفزات المعقدة.
  • يتم إرجاع الإجابة الكاملة دفعة واحدة عند انتهاء النموذج، وليس رمزا تلو الآخر. يتم قبول البث، لكنه يقدم الاستجابة الكاملة في النهاية بدلا من بث الرموز أثناء توليدها.
  • اترك مساحة max_tokens واسعة، لأن الحدود الصغيرة جدا قد تقصص أو تفرغ الإجابة.

** المسؤوليات**

  • إدخال نص وصورة، مع سياق رمز بمقدار 1 مليون.
  • دائما ما يكون هناك منطق. العالي هو الافتراضي؛ xhigh و max هما نفس الحد الأقصى للجهد.
  • استدعاء الدوال، وضع JSON، وبحث ويب مدمج يستشهد بمصدره عند توفره (بدون رسوم منفصلة).

**

  • يتم احتساب الرمز بناء على الاستخدام الكامل للتوكن، بما في ذلك رموز التنسيق التي يستخدمها النموذج داخليا، لذا حتى الإشعارات القصيرة تحمل بعض التكلفة.
  • المستوى السياقي: الطلبات التي تزيد عن 272 ألف رمز إدخال إجمالي تستخدم المعدل الأعلى المعروض.

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.