Fugu Ultra

Sakana AI · Text Generation
POST /v1/chat/completions多智能体指挥,能够协调前沿专家模型,用于硬推理、编码和研究,支持100万上下文、图像输入和网页搜索。
一眼看
定价
示例请求
参数
注释
Fugu Ultra 是一个多智能体指挥者:每个请求协调一个专家模型池,并将他们的工作整合成一个单一答案。
延迟与流媒体
- 复杂提示的回复可能需要几秒钟到几分钟不等。
- 完整答案在模型完成时一次性返回,而不是按标记返回。流式传输是被接受的,但它是在最终交付完整的响应,而不是流式代币生成。
- 留max_tokens出宽裕的余量,因为非常小的限制可能会截断或清空答案。
能力
- 文本和图像输入,带有100万代币上下文。
- 始终在线的推理。高为默认;Xhigh和Max是相同的最大努力量。
- 函数调用、JSON 模式,以及内置的网页搜索,并在可用时注明来源(无需额外费用)。
账单
- 按全部令牌使用计费,包括模型内部使用的编排令牌,因此即使是短提示也会有一定成本。
- 上下文分级:请求超过272K总输入代币,使用显示的更高速率。
Machine可读模式: GET https://api.empiriolabs.ai/v1/models/fugu-ultra。
