Fugu Ultra

Fugu Ultra
Sakana AI · Text Generation
POST /v1/chat/completions

Director multiagente que orquesta modelos expertos de vanguardia para razonamiento duro, codificación e investigación, con contexto 1M, entrada de imágenes y búsqueda web.

A simple vista

CampoValor
ID de modelofugu-ultra
Fecha de lanzamiento del modelo2026-06-21
Modalidades de entradaTexto, Imagen
Modalidades de salidaTexto
Ventana de contexto1M
Precisión del peso-
Tokens de salida máximo131,072
Característicasrazonamiento, multimodal, web_search, function_calling, structured_output, agentic_coding, caché
Inferencia nativaNo
Nuevo
Puntos finales soportadosPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Precios

CargaEspecificacionesTarifa
Entradapor 1M de fichas de prompt<=272K $7.50; >272K $15.00
Producciónpor cada 1M de tokens generados<=272K $45.00; >272K $67.50
Lectura implícita de cachépor cada 1M de tokens de entrada en caché<=272K $1.50; >272K $3.00

Solicitud de ejemplo

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

Parámetros

ParámetroTipoObligatorioDefaultDescripción
max_tokensenterosno32768Número máximo de tokens de salida para la respuesta final. El conductor necesita espacio para trabajar, por lo que valores muy pequeños pueden devolver una salida vacía. · Rango: 1 – 131072
reasoning_effortenumno"high"Qué difícil Fugu Ultra razones. El razonamiento siempre está activo. El valor predeterminado es alto; Xhigh y Max son alias del mismo esfuerzo máximo (más completo y más lento que alto). · Permitidos: high, xhigh, max
tool_web_searchBooleanonofalsoActiva la búsqueda web integrada. No hay una tarifa separada; El coste de búsqueda se refleja en los tokens de orquestación facturados por la petición.
toolsMatrizno[]Definiciones de herramientas de llamada a funciones compatibles con OpenAI.
tool_choiceObjetono-Control de elección de herramientas compatible con OpenAI.
response_formatObjetono-Modo JSON compatible con OpenAI para salida estructurada.

Notas

Fugu Ultra es un conductor multiagente: cada solicitud coordina un conjunto de modelos expertos y compone su trabajo en una única respuesta.

Latencia y streaming

  • Las respuestas pueden durar desde unos segundos hasta unos minutos en prompts complejos.
  • La respuesta completa se devuelve de golpe cuando termina el modelo, no ficha por ficha. El streaming es aceptado, pero ofrece la respuesta completa al final en lugar de transmitir tokens a medida que se generan.
  • Deja un margen generoso max_tokens, ya que límites muy pequeños pueden truncar o vaciar la respuesta.

Capacidades

  • Entrada de texto e imagen, con un contexto de token de 1M.
  • Razonamiento siempre activo. alto es el valor por defecto; Xhigh y Max son el mismo esfuerzo máximo.
  • Llamada de función, modo JSON y búsqueda web integrada que cita sus fuentes cuando está disponible (sin pago separado).

Facturación

  • Se factura por el uso completo de tokens, incluyendo los tokens de orquestación que el modelo usa internamente, por lo que incluso los prompts cortos tienen cierto coste.
  • Niveles contextuales: las solicitudes por encima de 272K tokens de entrada totales utilizan la tasa más alta mostrada.

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.