Fugu Ultra

Fugu Ultra
Sakana AI · Text Generation
POST /v1/chat/completions

多智能体指挥,能够协调前沿专家模型,用于硬推理、编码和研究,支持100万上下文、图像输入和网页搜索。

一眼看

场地价值
型号IDfugu-ultra
车型发布日期2026-06-21
输入模态文本,图片
输出模态正文
上下文窗口1M
重量精度-
最大输出令牌131,072
特色推理、多模态、web_search、function_calling、structured_output、agentic_coding、缓存
本土推断
是的
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记<=272K $7.50;>272K $15.00
输出每100万个生成代币<=272K $45.00;>272K $67.50
隐式缓存读取每 1M 缓存输入标记<=272K $1.50;>272K $3.00

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
max_tokens整数32768最终答案的最大输出标记数。导体需要工作空间,因此非常小的输出可能为空。·射程:1 – 131072
reasoning_effort枚举"high"原因Fugu Ultra多么艰难。推理总是开着。默认值是高;xhigh和max是同一个最大努力的别名(比High更细致且更慢)。·允许:highxhighmax
tool_web_search布尔值错误启用内置的网页搜索功能。没有单独的费用;搜索成本反映在请求所计费的编排令牌上。
tools数组[]兼容 OpenAI 的函数调用工具定义。
tool_choice对象-兼容OpenAI的工具选择控制。
response_format对象-用于结构化输出的 OpenAI 兼容 JSON 模式。

注释

Fugu Ultra 是一个多智能体指挥者:每个请求协调一个专家模型池,并将他们的工作整合成一个单一答案。

延迟与流媒体

  • 复杂提示的回复可能需要几秒钟到几分钟不等。
  • 完整答案在模型完成时一次性返回,而不是按标记返回。流式传输是被接受的,但它是在最终交付完整的响应,而不是流式代币生成。
  • 留max_tokens出宽裕的余量,因为非常小的限制可能会截断或清空答案。

能力

  • 文本和图像输入,带有100万代币上下文。
  • 始终在线的推理。高为默认;Xhigh和Max是相同的最大努力量。
  • 函数调用、JSON 模式,以及内置的网页搜索,并在可用时注明来源(无需额外费用)。

账单

  • 按全部令牌使用计费,包括模型内部使用的编排令牌,因此即使是短提示也会有一定成本。
  • 上下文分级:请求超过272K总输入代币,使用显示的更高速率。

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/fugu-ultra