Fugu Ultra | EmpirioLabs AI Docs

Sakana AI · Text Generation

POST /v1/chat/completions

Director multiagente que orquesta modelos expertos de vanguardia para razonamiento duro, codificación e investigación, con contexto 1M, entrada de imágenes y búsqueda web.

A simple vista

Campo	Valor
ID de modelo	`fugu-ultra`
Fecha de lanzamiento del modelo	2026-06-21
Modalidades de entrada	Texto, Imagen
Modalidades de salida	Texto
Ventana de contexto	1M
Precisión del peso	-
Tokens de salida máximo	131,072
Características	razonamiento, multimodal, web_search, function_calling, structured_output, agentic_coding, caché
Inferencia nativa	No
Nuevo	Sí
Puntos finales soportados	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Precios

Carga	Especificaciones	Tarifa
Entrada	por 1M de fichas de prompt	<=272K $7.50; >272K $15.00
Producción	por cada 1M de tokens generados	<=272K $45.00; >272K $67.50
Lectura implícita de caché	por cada 1M de tokens de entrada en caché	<=272K $1.50; >272K $3.00

Solicitud de ejemplo

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

Parámetros

Parámetro	Tipo	Obligatorio	Default	Descripción
`max_tokens`	enteros	no	`32768`	Número máximo de tokens de salida para la respuesta final. El conductor necesita espacio para trabajar, por lo que valores muy pequeños pueden devolver una salida vacía. · Rango: 1 – 131072
`reasoning_effort`	enum	no	`"high"`	Qué difícil Fugu Ultra razones. El razonamiento siempre está activo. El valor predeterminado es alto; Xhigh y Max son alias del mismo esfuerzo máximo (más completo y más lento que alto). · Permitidos: `high`, `xhigh`, `max`
`tool_web_search`	Booleano	no	falso	Activa la búsqueda web integrada. No hay una tarifa separada; El coste de búsqueda se refleja en los tokens de orquestación facturados por la petición.
`tools`	Matriz	no	`[]`	Definiciones de herramientas de llamada a funciones compatibles con OpenAI.
`tool_choice`	Objeto	no	-	Control de elección de herramientas compatible con OpenAI.
`response_format`	Objeto	no	-	Modo JSON compatible con OpenAI para salida estructurada.

Notas

Fugu Ultra es un conductor multiagente: cada solicitud coordina un conjunto de modelos expertos y compone su trabajo en una única respuesta.

Latencia y streaming

Las respuestas pueden durar desde unos segundos hasta unos minutos en prompts complejos.
La respuesta completa se devuelve de golpe cuando termina el modelo, no ficha por ficha. El streaming es aceptado, pero ofrece la respuesta completa al final en lugar de transmitir tokens a medida que se generan.
Deja un margen generoso max_tokens, ya que límites muy pequeños pueden truncar o vaciar la respuesta.

Capacidades

Entrada de texto e imagen, con un contexto de token de 1M.
Razonamiento siempre activo. alto es el valor por defecto; Xhigh y Max son el mismo esfuerzo máximo.
Llamada de función, modo JSON y búsqueda web integrada que cita sus fuentes cuando está disponible (sin pago separado).

Facturación

Se factura por el uso completo de tokens, incluyendo los tokens de orquestación que el modelo usa internamente, por lo que incluso los prompts cortos tienen cierto coste.
Niveles contextuales: las solicitudes por encima de 272K tokens de entrada totales utilizan la tasa más alta mostrada.

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.