Fugu Ultra

Sakana AI · Text Generation
POST /v1/chat/completionsDirector multiagente que orquesta modelos expertos de vanguardia para razonamiento duro, codificación e investigación, con contexto 1M, entrada de imágenes y búsqueda web.
A simple vista
Precios
Solicitud de ejemplo
Parámetros
Notas
Fugu Ultra es un conductor multiagente: cada solicitud coordina un conjunto de modelos expertos y compone su trabajo en una única respuesta.
Latencia y streaming
- Las respuestas pueden durar desde unos segundos hasta unos minutos en prompts complejos.
- La respuesta completa se devuelve de golpe cuando termina el modelo, no ficha por ficha. El streaming es aceptado, pero ofrece la respuesta completa al final en lugar de transmitir tokens a medida que se generan.
- Deja un margen generoso max_tokens, ya que límites muy pequeños pueden truncar o vaciar la respuesta.
Capacidades
- Entrada de texto e imagen, con un contexto de token de 1M.
- Razonamiento siempre activo. alto es el valor por defecto; Xhigh y Max son el mismo esfuerzo máximo.
- Llamada de función, modo JSON y búsqueda web integrada que cita sus fuentes cuando está disponible (sin pago separado).
Facturación
- Se factura por el uso completo de tokens, incluyendo los tokens de orquestación que el modelo usa internamente, por lo que incluso los prompts cortos tienen cierto coste.
- Niveles contextuales: las solicitudes por encima de 272K tokens de entrada totales utilizan la tasa más alta mostrada.
Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.
