Fugu Ultra

Fugu Ultra
Sakana AI · Text Generation
POST /v1/chat/completions

100万のコンテキスト、画像入力、ウェブ検索を用いて、ハード推論、コーディング、研究のためにフロンティアの専門家モデルをオーケストレーションするマルチエージェント指揮者。

一目で

フィールド価値
モデルIDfugu-ultra
モデル発売日2026-06-21
入力モダリティテキスト、画像
出力モダリティ本文
コンテキストウィンドウ1M
重量精度-
最大出力トークン131,072
特徴推論、マルチモーダル、web_search、function_calling、structured_output、agentic_coding、キャッシュ
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり<=272K $7.50;>272K $15.00
出力生成された1Mトークンあたり<=272K $45.00;>272K $67.50
暗黙のキャッシュ読み取り1Mのキャッシュ入力トークンごとに<=272K $1.50;>272K $3.00

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
max_tokens整数いいえ32768最終回答の最大出力トークン数。導体は作業スペースが必要なため、非常に小さな値は空の出力を返すことがあります。·射程:1 – 131072
reasoning_effortエヌムいいえ"high"理由Fugu Ultraどれほど難しいか。理屈は常に有効です。デフォルトは高いです。xhighとmaxは同じ最大努力(より徹底的で遅い)の別名です。·許可:highxhighmax
tool_web_searchブール値いいえ偽り組み込みのウェブ検索を有効にしてください。別料金はかかりません。検索コストはリクエストに対して請求されるオーケストレーショントークンに反映されます。
tools配列いいえ[]OpenAI互換の関数呼び出しツール定義。
tool_choice目的いいえ-OpenAI互換のツール選択制御。
response_format目的いいえ-構造化出力用のOpenAI互換JSONモード。

注記

Fugu Ultraはマルチエージェントの指揮者であり、各依頼が専門家モデルのプールを調整し、それらの作業を単一の回答にまとめます。

遅延とストリーミング

  • 複雑なプロンプトでは、返答は数秒から数分で済むことがあります。
  • モデルが完成すると、トークンごとにトークンではなく、すべての回答が一度に返されます。ストリーミングは受け入れられますが、トークンを生成する際にストリームが生成されるのではなく、最終的に完全なレスポンスを届けます。
  • 非常に小さな制限が答えを切り詰めたり空にしたりする可能性があるため、十分な余裕max_tokens残してください。

能力

  • テキストと画像の入力、1Mトークンコンテキスト。
  • 常に理屈に乗る。高がデフォルトです。xhighとmaxは同じ最大努力値です。
  • 関数呼び出し、JSONモード、利用可能な場合は出典を明示する組み込みウェブ検索(別料金なし)。

請求

  • モデルが内部で使用するオーケストレーショントークンを含め、トークン使用量を全額で請求するため、短いプロンプトでも一定のコストが発生します。
  • コンテキストティアド:272,000を超えるリクエストは、示されたより高いレートを使用します。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/fugu-ultra