Fugu Ultra

Sakana AI · Text Generation
POST /v1/chat/completionsChef d’orchestre multi-agents qui orchestre des modèles experts de pointe pour le raisonnement approfondi, le codage et la recherche, avec 1M de contexte, saisie d’images et recherche web.
En un coup d’œil
Tarification
Exemple de demande
Paramètres
Notes
Fugu Ultra est un conducteur multi-agents: chaque requête coordonne un pool de modèles experts et compose leur travail en une seule réponse.
Latence et streaming
- Les réponses peuvent prendre de quelques secondes à quelques minutes sur des consignes complexes.
- La réponse complète est retournée d’un coup à la fin du modèle, et non jeton par jeton. Le streaming est accepté, mais il offre la réponse complète à la fin plutôt que de diffuser les tokens au fur et à mesure qu’ils sont générés.
- Laissez une marge de max_tokens généreuse, car de très petites limites peuvent tronquer ou vider la réponse.
Capacités
- Saisie texte et image, avec un contexte de jeton 1M.
- Raisonnement toujours actif. « élevé » est la norme; Xhigh et Max demandent le même effort maximal.
- Appel de fonction, mode JSON, et recherche web intégrée qui cite ses sources lorsque disponible (sans frais séparés).
Facturation
- Facturé sur l’utilisation complète des jetons, y compris les jetons d’orchestration utilisés en interne par le modèle, donc même les courtes invitations ont un certain coût.
- Palier contextuel: les requêtes supérieures à 272K de jetons d’entrée totaux utilisent le taux plus élevé indiqué.
_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/fugu-ultra.
