API参照
API参照
完全なREST サーフェス - チャット、埋め込み、ランク付け、画像、動画、3D、音声、文字起こし、検索、検出、ジョブ
EmpirioLabsはOpenAIおよびAnthropic互換のリクエスト形状を話します。任意のSDKを入れて、https://api.empiriolabs.aiに向け、EmpirioLabsのAPIキーで認証してください。以下のすべてのエンドポイントは、変更せずにOpenAIやAnthropicクライアントに対して動作します。
認証
すべてのリクエストはベアラートークンを必要とします。どのヘッダーでもすべてのエンドポイントで受け入れられます:
エンドポイント曲面
OpenAI対応チャット。ストリーミング、ツールコール、ビジョン、オーディオ入力、JSONモード、構造化出力、推論コントロール。
POST /v1/completionsを宣伝するモデル向けのOpenAI互換プロンプト補完。
Anthropic SDKクライアント向けのドロップイン。tool_use / tool_resultブロックは往復できれいに行います。
生成、編集、インペイント、画像のバリエーション。ホストされたCDNのURLで、7日間署名済み。
非同期動画生成。job_id返す;ジョブエンドポイントにURLを投票します。
TTSに加えてリアルタイムストリーミングTTS(Inworld)、音楽/ポッドキャスト/SFX生成、音声クローン管理も可能です。
長期にわたるツール使用エージェントタスク。開始、投票、メッセージ配信、早めに終了。
ウィスパー/Deepgram/インコ。マルチパートのアップロードまたはfile_url。
Exa、Tavily、Linkup、Perplexity 検索。ドメインフィルター、日付範囲、ジオバイアス。
非同期画像から3Dへのアセット生成。job_id返す;署名済みGLBのURLを投票で行います。
POST /v1/detect - GPTZeroのAI検出、文献リストスキャン、情報源分析。
OpenAI互換の埋め込み。多言語テキスト+マルチモーダル埋め込み。
意味文書の再ランク付け。検索候補をRAGの関連性でソートし、検索の精査を行います。
入力欄に公開URLを渡します。アップロードも再署名もなし - 生成された出力は7日間有効です。
非同期生成のステータスや結果をポーリングしてください。州は終了後1時間の猶予を保持しました。
価格設定、パラメータスキーマ、能力フラグ、地域を含むライブカタログ。
OpenAIおよびAnthropic互換のエラーエンベロープ。
チャット完了
POST /v1/chat/completions
カタログからチャット対応のモデルは何でもmodelとして渡してください。ストリーミングはサーバー送信イベントで、data: ...ラインと最終data: [DONE]を使用します。
各モデルの受け入れパラメータはドキュメントページに掲載されています(例:temperature、top_p、enable_thinking、reasoning_effort、web_search_tier)。プロバイダーとモデルで閲覧してください。
エンドポイント間のモデルパラメータ
モデルページやGET /v1/models/\{id\}で広告されているモデル固有のパラメータは、そのモデルがエンドポイントをサポートする際に/v1/chat/completions、/v1/responses、/v1/messagesに送信できます。ゲートウェイはリクエスト形状を適応させ、同じコントロールが基礎モデルに届くようにします。
思考能力を持つモデルでは、3つのテキストエンドポイントすべてでenable_thinkingとthinking_budgetが受け入れられます。/v1/messagesでは、人間主義的な思考も使えます:
これはチャットの完了やレスポンスと同じenable_thinking=trueやthinking_budget=1024コントロールに対応しています。
レガシー完成
POST /v1/completions
このエンドポイントは、チャットmessagesではなく生のpromptを送信するOpenAI互換クライアントに使うべきです。POST /v1/completionsがsupported_endpointsに記載されているモデルのみがこの形状を受け入れています。
ストリーミングはサーバー送信イベントを使用し、モデルサービスが報告する際に使用状況も含めます。
Anthropicメッセージ
POST /v1/messages
任意のAnthropic SDKクライアントへのドロップイン - /v1/chat/completionsや/v1/responsesでアクセス可能な同じモデルは、こちらのAnthropic Messagesフォームからアクセス可能です。
tool_useブロックとtool_resultブロックは往復できれいに行っています。混合text-plus-tool_useコンテンツアレイは保存されます。
画像生成
POST /v1/images/generations
画像編集フローは、モデルのドキュメント上の制限(qwen-image-2-0が3、wan-2-7-imageが9、seedream-5-0-liteが14)までの最大限image: ["https://..."]を受け付けます。イメージセットモードは一貫した系列を生成します - トグルは各モデルのページをご覧ください。
返却されたURLはhttps://media.empiriolabs.ai上に公開され、7日で期限切れになります。URLが切れる前に残したいものは保存してください。
POST /v1/images/analysis1つ以上の入力画像に対して視覚のみ(生成なし)解析を実行します。レイアウト抽出、オブジェクト検出、OCRなどの検査作業に使用され、モデルが画像を説明するテキストやJSONを返す場合に利用されます。
ビデオ生成
POST /v1/videos/generations
常に非同期 - エンドポイントはjob_idとポーリングURLを返します。
音声生成
同期POST /v1/audio/speech、デフォルトでホストされたURLを返します。インラインオーディオバイトのためにresponse_format: "b64_json"をパスします。
POST /v1/audio/speech:streamリアルタイムTTS。モデルが合成する際にサーバー送信イベントを返します。Inworld TTS Miniでは130ms未満のtime-to-first-byte、Maxでは250ms未満。音声エージェントやインタラクティブ再生に使用可能です。現在はInworld TTS Mini / Maxでサポートされています。他のTTSモデルでは同期エンドポイントを使用します。
POST /v1/audio/generations音楽、ポッドキャスト、効果音の生成。Stable Audio、GLM TTS、MOSS、SoulX Podcast、prompt-to-audio形状がTTSと異なる部分をカバーしています。
GET /v1/voices声のリストと管理、Inworld TTS用のカスタムボイスクローンも含まれます。返されたvoice_idをどちらのスピーチのエンドポイントにも使ってください。
転写
POST /v1/audio/transcriptions
マルチパートfileアップロードかJSONペイロードのどちらかをfile_url対応します。
5分以上の長いファイルは非同期ジョブシステムに自動ルーティングされます。応答にはインラインテキストではなくjob_idが含まれます。ジョブエンドポイントをポーリングして最終的なトランスクリプトを取得します。
検索と研究
POST /v1/search検索スタイルモデルのための統一検索面です。各モデルごとの正確な受け入れパラメータは各モデルのページに存在します(例:exa-searchはcategory、livecrawl、subpages、summary_query、code_tokensを含む28のパラメータを公開しています)。
POST /v1/research深層研究/多段階検索モデル(Exa Research、Perplexity Deep Research、Linkup Deep Search)です。引用された情報源を含む構造化された研究報告書を生成する。
POST /v1/answer直接質問回答モデル(Exa Answer)。簡潔な回答と引用を返しますが、完全なレポートの形状は含めません。
エージェント
長期実行のツール使用エージェントタスク(現在はManusにルーティングされています)。一度投稿してからステータスやstep-by-stepメッセージを投票するか、早めに中断してください。
POST /v1/agents/run二重の役割を果たしています:
task_idがなければ、新たな作業が始まります。その回答には新たなtask_idが載っています。task_idでは既存のタスクにフォローアップメッセージを送信します。エージェントは次の判断でそれを拾います。
GET /v1/agents/\{task_id\}タスクの現在の状況と最終結果を取得します。
GET /v1/agents/\{task_id\}/messagesこれまでにエージェントが行ったすべてのステップをリストアップしてください。最終回答と並行してリアルタイムの推論トレースを表示するのに便利です。
POST /v1/agents/\{task_id\}/stop進行中のタスクを停止します。請求は、エージェントがすでに完了した作業で和解します。
3D生成
POST /v1/3d/generations
画像から3Dへの生成は非同期です。エンドポイントはjob_idとポーリングURLを返します。ジョブエンドポイントをポーリングして最終署名済みGLB URLを取得します。
trellis-2-4bモデルページ上で画像、解像度、サンプラー、テクスチャ、メッシュのエクスポートパラメータ表面全体を公開します。
検出
POST /v1/detect
専門的なテキスト分類エンドポイント。現在はGPTZero(AI検出、文献検索、ソース分析)を運用しています。各モデルのscan_type列挙は上流経路を選択します。パラメータ曲面の全表示はモデルごとのドキュメントを参照してください。
GPTZeroは/v1/chat/completionsや/v1/responsesを通じてもアクセス可能です。メッセージ本体にテキストを渡すと、ゲートウェイが通話を適応させます。検出要約はアシスタントメッセージとして返ってきます。代わりに生の上流JSONを受け取るためにdisable_formatting: trueパスします。
埋め込み
POST /v1/embeddings
OpenAI互換の埋め込み。多言語テキストおよびマルチモーダル(テキスト+画像+ビデオ)埋め込みも利用可能です。
階級の再昇格
POST /v1/reranks
候補documentsをqueryとの意味的関連性で並べ替えてください。各文書の元の索引と0-1の関連性スコア(高いほど関連性が高い)を返します。これを使い、ベクターストア/BM25/ハイブリッドリトリバーの出力を厳密にし、トップヒットを言語モデルに渡すというRAGパイプラインの標準的な最終ステップです。
オプションのinstructパラメータは、Q&A取得(デフォルト)と純粋な意味的類似性ソートを切り替えます - パラメータ表の全表はqwen3-rerankモデルページを参照してください。
使用オブジェクト
使用量を請求するすべてのエンドポイントは、レスポンス(および端末のストリーミングチャンク)にusageフィールドを返します。ベース形状:
cost_usd- 請求に対してあなたのアカウントが請求された正確な金額です。権威ある。prompt_tokens/completion_tokens/total_tokens- チャットスタイルのモデル向け。- キャッシュフィールド(
cache_read_input_tokens、cache_creation_input_tokens) - プロンプトキャッシュが適用される場合。
階層別、通話ごとの価格、またはバリアント価格の上流モデルは、usageに追加の項目を刻印し、どのレートが適用されたか確認できます:
- **ティア/バリアント価格。**同じ次元に複数の料金がある場合、労働者は
usageにティア判別器を刻印します。主なフィールドはpricing_tier_label(人間が読みやすいもの、例:"Medium context"/"Pro"/"2K")です。年配の作業者は生寸法に直接スタンプを押すこともあります(resolution、quality、mode、rate_tier)。ダッシュボードは、そこにいるバッジのバッジを表示します。 - 通話ごとの価格設定。 ツール呼び出し(検索、取出、コード実行など)ごとに請求する作業員は、スタンプを
tool_calls_details.<tool>.invocationまたはtool_usage.<tool>未満でカウントします。ダッシュボードはこれらを自動的にツールごとの内訳に拡張します。 - 次元ごとの価格設定。 複数の次元を1回のリクエストで請求する作業者は(例:引用トークン+推論トークン+ディープリサーチモデルの検索クエリ)、各次元を独立したフィールド(
citation_tokens、reasoning_tokens、num_search_queriesなど)としてスタンプします。
同じフィールドがダッシュボードの使用ログ上のティアバッジやツールごとの内訳を制御し、各イベントのmetadata.worker_usage下にあるGET /v1/account/usageの履歴エンドポイント(および通話ごとの構造化tool_breakdown配列)からも返されます。つまり、ライブレスポンス利用状況、アカウント利用履歴、ダッシュボードのいずれを読んでも、ティアと請求の内訳は正確に一致します。
ファイルURL
EmpirioLabsはユーザーのアップロードをホストしていません。任意の公開URLをモデルエンドポイントの入力フィールドに直接渡します:
特に音声の文字起こしに関しては、/v1/audio/transcriptionsのマルチパートダイレクトアップロードがURLにないプライベートクリップのサポート経路であり、そのバイトは永続的な保存なしでspeech-to-textワーカーに直接流れます。
生成された出力URLは署名され、作成後7日で期限切れとなります。再署名エンドポイントはありません。必要なもの、URLもバイナリもそのウィンドウ内に保存してください。
非同期ジョブ
GET /v1/jobs/<job-id> - 非同期生成や転写ジョブの状況や最終結果をポーリングします。
ジョブステートは終了後1時間保持されます。
statusがcompletedされると、result場は同期端点が返すはずの形状で完全な応答を伝えます。
受信HTTPタイムアウトは15分です。同期チャット完了がその限界近くで動作するとstream=true部分的な出力が戻り、接続が温かいまま維持されるはずです。
モデル
GET /v1/models - 利用可能なすべてのモデルをリストアップしてください。
GET /v1/models/<model-id> - 1つのモデルの完全なスキーマで、そのパラメータテーブルも含まれます。
GET /v1/models?format=openrouterパートナーインジェスメント準備完了とマークされたモデルに対してOpenRouterのモデルリスト形状を返します。正確な応答フィールドについてはOpenRouterモデルリストを参照してください。
各モデルは以下の通りです:
disable_formatting旗
多くのチャット、検索、リサーチ、リランクのエンドポイントはdisable_formatting=trueフラグを受け入れています。サポートモデルに設定された場合、ワーカーはEmpirioLabsのサーバー側フォーマット(引用書き換え、参考文献ブロック、思考ブロックのMarkdownなど)をスキップし、上流のペイロード形状を逐語的に返します。
カバレッジはモデルごとに広告されます。supports_passthroughのGET /v1/models/\{id\}で特定のモデルが旗を尊重しているか確認してください。supports_passthrough: true広告を出すモデルは、raw=true、passthrough=true、raw_response=trueの別名も受け入れています。そのフィールドを持たないモデルは、標準的なdisable_formatting=true形式のみを受け入れるか、パススルーを全く認めません。モデルカードには、各モデルが受け入れるエイリアスが記載されています。
画像、映像、音声生成、文字起こし、埋め込みエンドポイントは、これらのエンドポイントに無効化可能なフォーマットレイヤーがないため、このフラグを受け付けません。
生成されたメディア保持率
生成された画像、動画、音声は、有効期限が7日の署名済みURLとして返されます。その後はURLが機能しなくなり、アセットは消えます - 再署名エンドポイントは存在しません。7日間の期限が切れる前に残したいものは保存してください。
誤り
OpenAIのエンベロープでチャット/応答/画像/動画/音声/検索/埋め込み/再ランク:
Anthropic封筒/v1/messages:
ヘッダー参照
Providers and Modelsの下でモデルごとのパラメータスキーマを閲覧してください。特定のモデルをクリックすると、モデルが受け入れるすべてのパラメータ(型、デフォルト、範囲、許容値、条件フラグ)がライブデータベースから生成されたテーブルに記録されます。
