Fugu Ultra

Sakana AI · Text Generation

POST /v1/chat/completions

多智能体指挥，能够协调前沿专家模型，用于硬推理、编码和研究，支持100万上下文、图像输入和网页搜索。

一眼看

场地	价值
型号ID	`fugu-ultra`
车型发布日期	2026-06-21
输入模态	文本，图片
输出模态	正文
上下文窗口	1M
重量精度	-
最大输出令牌	131,072
特色	推理、多模态、web_search、function_calling、structured_output、agentic_coding、缓存
本土推断	不
新	是的
支持的端点	`POST /v1/chat/completions`，`POST /v1/responses`，`POST /v1/messages`

定价

冲锋	规格	速率
输入	每100万个提示词标记	<=272K $7.50;>272K $15.00
输出	每100万个生成代币	<=272K $45.00;>272K $67.50
隐式缓存读取	每 1M 缓存输入标记	<=272K $1.50;>272K $3.00

示例请求

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数	类型	必修	默认	描述
`max_tokens`	整数	不	`32768`	最终答案的最大输出标记数。导体需要工作空间，因此非常小的输出可能为空。·射程：1 – 131072
`reasoning_effort`	枚举	不	`"high"`	原因Fugu Ultra多么艰难。推理总是开着。默认值是高;xhigh和max是同一个最大努力的别名（比High更细致且更慢）。·允许：`high`，`xhigh`，`max`
`tool_web_search`	布尔值	不	错误	启用内置的网页搜索功能。没有单独的费用;搜索成本反映在请求所计费的编排令牌上。
`tools`	数组	不	`[]`	兼容 OpenAI 的函数调用工具定义。
`tool_choice`	对象	不	-	兼容OpenAI的工具选择控制。
`response_format`	对象	不	-	用于结构化输出的 OpenAI 兼容 JSON 模式。

注释

Fugu Ultra 是一个多智能体指挥者：每个请求协调一个专家模型池，并将他们的工作整合成一个单一答案。

延迟与流媒体

复杂提示的回复可能需要几秒钟到几分钟不等。
完整答案在模型完成时一次性返回，而不是按标记返回。流式传输是被接受的，但它是在最终交付完整的响应，而不是流式代币生成。
留max_tokens出宽裕的余量，因为非常小的限制可能会截断或清空答案。

能力

文本和图像输入，带有100万代币上下文。
始终在线的推理。高为默认;Xhigh和Max是相同的最大努力量。
函数调用、JSON 模式，以及内置的网页搜索，并在可用时注明来源（无需额外费用）。

账单

按全部令牌使用计费，包括模型内部使用的编排令牌，因此即使是短提示也会有一定成本。
上下文分级：请求超过272K总输入代币，使用显示的更高速率。

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/fugu-ultra。