制限とAPIキー

本番制限、APIキー、GPU Cloud、ホストエージェント、Playgroundの保存チャット、リクエストの増加

各アカウントはデフォルトの生産制限を受け取り、利用率が増えるにつれてより高い制限を要求できます。以下のデフォルト設定はライブプラットフォームの設定と同期しています。

デフォルトの口座上限

制限デフォルト
1分あたりのリクエスト数50回転
トークン数/分2,000,000 TPM
アカウントごとのAPIキー50
アカウントごとのGPU数GPU Cloud10
アカウントごとのホストエージェント数3
アカウントごとの保存された遊び場チャット50

本番作業の上限を高くしたい場合は、support@empiriolabs.aiにメールしてください。

APIキー形式

APIキーはsk-empiriolabs-プレフィックスを使用します:

1Authorization: Bearer sk-empiriolabs-...

APIキーはサーバー側のみに保管してください。ブラウザコード、モバイルアプリ、公開リポジトリ、クライアントログなどに絶対に公開しないでください。

GPU Cloudの限界

GPU Cloudの上限はアカウントごとに異なります。上記のデフォルトはライブプラットフォームの設定から来ており、ダッシュボードの設定ページで実効制限が表示されます。

マルチGPU展開では、各GPUが上限にカウントされます。例えば、1つの2GPUインスタンスは2つのGPUスロットを使用します。停止したインスタンスは展開スペックを維持し、破壊されるまでGPU Cloud制限にカウントし続けます。

ディスクサイズはインスタンスあたり100GBから300GBまで設定可能です。GPUの展開や起動には、最初の稼働期間分のクレジット残高も必要です。

ホストエージェントの制限

ホストエージェントの制限はアカウントスコープで決まります。上記のデフォルトはライブプラットフォームの設定から来ており、ダッシュボードの設定ページで実効制限が表示されます。

停止されたホストエージェントは管理されたランタイム状態を維持し、破壊されるまで制限にカウントし続けます。ホストエージェントの作成や更新には、選択した月額プランに十分なクレジット残高が必要です。

APIキーの管理

  • ダッシュボードから新しいキーを生成する
  • 各アカウントは最大50個のAPIキーを保持可能です(調整可能、サポートにお問い合わせください)
  • 未使用のキーは速やかに削除して攻撃面を減らしましょう
  • 環境を分離するために、プロダクション、ステージング、開発に別々のキーを使いましょう

保存された遊び場のチャット

Playgroundは会話を自動保存してくれるので、後で役立つモデルテストやプロンプト、回答に戻ってきてくれます。

保存されたPlaygroundチャット履歴は、現在サポートされているチャットモデルやモードのテキスト会話をカバーしています。チャットの書き起こしが保存されていなくても、メディア生成、検索、文字起こし、agent/task、その他の非テキストのPlaygroundランは使用履歴を通じて確認可能です。

舞台設定行動
デフォルトの保存チャット上限アカウントあたり50件の保存チャット
キャップで新しいチャットターンは引き続き実行されますが、古いチャットを削除するかより高い制限を要求しないと、追加の会話は保存されません
パブリックAPIGET /v1/playground/conversationsを使って保存したチャットをリストアップし、GET /v1/playground/conversations/\{id\}を読み込む

PlaygroundのUIはチャットヘッダーにもステータスチップを表示します:

チップ意味
Saved最新の確定ターンは持続します
Savingクライアントは600msの自動セーブデバウンスを待っています
Not savingアカウントはチャットの保存上限に達したため、新しいターンは続きますが保存されません

公開の保存チャットAPIは読み取り専用です。チャットの保存や削除は依然としてPlaygroundのダッシュボードで行われます。

方法経路目的
GET/v1/playground/conversations保存された会話のリスト
GET/v1/playground/conversations/\{id\}メッセージ付きの保存済み会話を1つ読み込む

レートリミットの挙動

レート制限を超えると、APIは返429 Too Many Requests応答を返します。リトライの際にジッターを混ぜた指数的なバックオフを使ってください。

レート制限はAPIキーごとにではなく、アカウントごとに適用されます。同じアカウントのすべてのキーは同じRPMとTPMの予算を共有しています。

より高い限度額の要求

作業量がデフォルトの50RPMや2M TPMを超える必要がある場合は、support@empiriolabs.aiにメールで送ってください:

  • アカウントのメールアドレスまたはアカウントIDです
  • 必要な制限とその理由
  • 予想されるトラフィックパターン(ピークRPM、平均リクエストサイズ)

よくある誤り

コード意味
missing_api_keyベアラートークンは提供されませんでした。
invalid_api_keyトークンが不形、非アクティブ、期限切れ、または見つからない場合。
insufficient_creditsアカウントはAPI呼び出しを行う前にさらにクレジットが必要です。
model_not_found要望されたモデルは存在しないか、利用できません。
rate_limit_exceededアカウントはRPMまたはTPMの上限を超えています。バックオフで再挑戦します。
gpu_limit_exceededアカウントはGPU Cloud限度額に達しました。インスタンスを破棄したり、GPU数を減らす、あるいはより高い制限を要求したりします。
agent_limit_reachedアカウントはホストエージェントの上限に達しました。未使用のエージェントを破壊するか、より高い上限を要求してください。
model_unavailableモデルのワーカーは一時的にオフラインです。すぐに再挑戦してください。
upstream_errorモデル提供者はエラーを返しました。