Fugu Ultra | EmpirioLabs AI Docs

Sakana AI · Text Generation

POST /v1/chat/completions

100万のコンテキスト、画像入力、ウェブ検索を用いて、ハード推論、コーディング、研究のためにフロンティアの専門家モデルをオーケストレーションするマルチエージェント指揮者。

一目で

フィールド	価値
モデルID	`fugu-ultra`
モデル発売日	2026-06-21
入力モダリティ	テキスト、画像
出力モダリティ	本文
コンテキストウィンドウ	1M
重量精度	-
最大出力トークン	131,072
特徴	推論、マルチモーダル、web_search、function_calling、structured_output、agentic_coding、キャッシュ
ネイティブ推論	いいえ
新作	はい
サポート端末	`POST /v1/chat/completions`、`POST /v1/responses`、`POST /v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	<=272K $7.50;>272K $15.00
出力	生成された1Mトークンあたり	<=272K $45.00;>272K $67.50
暗黙のキャッシュ読み取り	1Mのキャッシュ入力トークンごとに	<=272K $1.50;>272K $3.00

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "fugu-ultra", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`max_tokens`	整数	いいえ	`32768`	最終回答の最大出力トークン数。導体は作業スペースが必要なため、非常に小さな値は空の出力を返すことがあります。·射程:1 – 131072
`reasoning_effort`	エヌム	いいえ	`"high"`	理由Fugu Ultraどれほど難しいか。理屈は常に有効です。デフォルトは高いです。xhighとmaxは同じ最大努力(より徹底的で遅い)の別名です。·許可:`high`、`xhigh`、`max`
`tool_web_search`	ブール値	いいえ	偽り	組み込みのウェブ検索を有効にしてください。別料金はかかりません。検索コストはリクエストに対して請求されるオーケストレーショントークンに反映されます。
`tools`	配列	いいえ	`[]`	OpenAI互換の関数呼び出しツール定義。
`tool_choice`	目的	いいえ	-	OpenAI互換のツール選択制御。
`response_format`	目的	いいえ	-	構造化出力用のOpenAI互換JSONモード。

注記

Fugu Ultraはマルチエージェントの指揮者であり、各依頼が専門家モデルのプールを調整し、それらの作業を単一の回答にまとめます。

遅延とストリーミング

複雑なプロンプトでは、返答は数秒から数分で済むことがあります。
モデルが完成すると、トークンごとにトークンではなく、すべての回答が一度に返されます。ストリーミングは受け入れられますが、トークンを生成する際にストリームが生成されるのではなく、最終的に完全なレスポンスを届けます。
非常に小さな制限が答えを切り詰めたり空にしたりする可能性があるため、十分な余裕max_tokens残してください。

能力

テキストと画像の入力、1Mトークンコンテキスト。
常に理屈に乗る。高がデフォルトです。xhighとmaxは同じ最大努力値です。
関数呼び出し、JSONモード、利用可能な場合は出典を明示する組み込みウェブ検索(別料金なし)。

請求

モデルが内部で使用するオーケストレーショントークンを含め、トークン使用量を全額で請求するため、短いプロンプトでも一定のコストが発生します。
コンテキストティアド:272,000を超えるリクエストは、示されたより高いレートを使用します。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/fugu-ultra。