Fugu Ultra

Sakana AI · Text Generation
POST /v1/chat/completionsMaestro multiagente que orquestra modelos especialistas de vanguarda para raciocínio rigoroso, codificação e pesquisa, com contexto 1M, entrada de imagem e busca na web.
De um olhar
Precificação
Exemplo de pedido
Parâmetros
Notas
Fugu Ultra é um condutor multi-agente: cada solicitação coordena um conjunto de modelos especialistas e compõe seu trabalho em uma única resposta.
Latência e streaming
- Respostas podem levar de alguns segundos a alguns minutos em prompts complexos.
- A resposta completa é retornada de uma vez quando o modelo termina, não token por token. O streaming é aceito, mas entrega a resposta completa no final, em vez de transmitir tokens conforme eles são gerados.
- Deixe um espaço generoso max_tokens cabeça, pois limites muito pequenos podem truncar ou esvaziar a resposta.
Capacidades
- Entrada de texto e imagem, com um contexto de token de 1M.
- Raciocínio sempre ligado. alto é o padrão; Xhigh e Max têm o mesmo esforço máximo.
- Chamada de função, modo JSON e busca web embutida que cita suas fontes quando disponível (sem taxa separada).
Faturamento
- Cobrado com base no uso total do token, incluindo os tokens de orquestração que o modelo usa internamente, então até mesmo prompts curtos têm algum custo.
- Em níveis de contexto: requisições acima de 272K tokens totais de entrada usam a taxa maior mostrada.
Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/fugu-ultra.
