Fugu Ultra

Sakana AI · Text Generation
POST /v1/chat/completionsMulti-Agent-Dirigent, der Pionier-Expertenmodelle für hartes Denken, Codieren und Forschung orchestriert, mit 1M Kontext, Bildeingabe und Websuche.
Auf einen Blick
Preisgestaltung
Beispielanfrage
Parameter
Anmerkungen
Fugu Ultra ist ein Multi-Agent-Conductor: Jede Anfrage koordiniert einen Pool von Expertenmodellen und fasst ihre Arbeit in einer einzigen Antwort zusammen.
Latenz und Streaming
- Antworten können auf komplexe Eingabeaufforderungen von wenigen Sekunden bis zu mehreren Minuten dauern.
- Die vollständige Antwort wird alle auf einmal zurückgegeben, wenn das Modell fertig ist, nicht Token für Token. Streaming wird akzeptiert, liefert aber am Ende die vollständige Antwort, anstatt Token, sobald sie generiert werden.
- Lassen Sie großzügig max_tokens Headroom, da sehr kleine Limits die Antwort verkürzen oder leeren können.
Fähigkeiten
- Text- und Bildeingabe mit einem 1M-Token-Kontext.
- Immer eingeschaltetes Denken. hoch ist der Standard; xhigh und max haben denselben maximalen Einsatz.
- Funktionsaufrufe, JSON-Modus und integrierte Websuche, die ihre Quellen zitiert, wenn verfügbar (keine separate Gebühr).
Abrechnung
- Sie werden bei der vollen Tokennutzung abgerechnet, einschließlich der internen Orchester-Tokens, die das Modell nutzt, sodass selbst kurze Prompts Kosten verursachen.
- Kontextstufen: Anfragen über insgesamt 272.000 Eingabetoken verwenden die höher angezeigte Rate.
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.
