制限とAPIキー
制限とAPIキー
本番制限、APIキー、GPU Cloud、ホストエージェント、Playgroundの保存チャット、リクエストの増加
各アカウントはデフォルトの生産制限を受け取り、利用率が増えるにつれてより高い制限を要求できます。以下のデフォルト設定はライブプラットフォームの設定と同期しています。
デフォルトの口座上限
本番作業の上限を高くしたい場合は、support@empiriolabs.aiにメールしてください。
APIキー形式
APIキーはsk-empiriolabs-プレフィックスを使用します:
APIキーはサーバー側のみに保管してください。ブラウザコード、モバイルアプリ、公開リポジトリ、クライアントログなどに絶対に公開しないでください。
GPU Cloudの限界
GPU Cloudの上限はアカウントごとに異なります。上記のデフォルトはライブプラットフォームの設定から来ており、ダッシュボードの設定ページで実効制限が表示されます。
マルチGPU展開では、各GPUが上限にカウントされます。例えば、1つの2GPUインスタンスは2つのGPUスロットを使用します。停止したインスタンスは展開スペックを維持し、破壊されるまでGPU Cloud制限にカウントし続けます。
ディスクサイズはインスタンスあたり100GBから300GBまで設定可能です。GPUの展開や起動には、最初の稼働期間分のクレジット残高も必要です。
ホストエージェントの制限
ホストエージェントの制限はアカウントスコープで決まります。上記のデフォルトはライブプラットフォームの設定から来ており、ダッシュボードの設定ページで実効制限が表示されます。
停止されたホストエージェントは管理されたランタイム状態を維持し、破壊されるまで制限にカウントし続けます。ホストエージェントの作成や更新には、選択した月額プランに十分なクレジット残高が必要です。
APIキーの管理
- ダッシュボードから新しいキーを生成する
- 各アカウントは最大50個のAPIキーを保持可能です(調整可能、サポートにお問い合わせください)
- 未使用のキーは速やかに削除して攻撃面を減らしましょう
- 環境を分離するために、プロダクション、ステージング、開発に別々のキーを使いましょう
保存された遊び場のチャット
Playgroundは会話を自動保存してくれるので、後で役立つモデルテストやプロンプト、回答に戻ってきてくれます。
保存されたPlaygroundチャット履歴は、現在サポートされているチャットモデルやモードのテキスト会話をカバーしています。チャットの書き起こしが保存されていなくても、メディア生成、検索、文字起こし、agent/task、その他の非テキストのPlaygroundランは使用履歴を通じて確認可能です。
PlaygroundのUIはチャットヘッダーにもステータスチップを表示します:
公開の保存チャットAPIは読み取り専用です。チャットの保存や削除は依然としてPlaygroundのダッシュボードで行われます。
レートリミットの挙動
レート制限を超えると、APIは返429 Too Many Requests応答を返します。リトライの際にジッターを混ぜた指数的なバックオフを使ってください。
レート制限はAPIキーごとにではなく、アカウントごとに適用されます。同じアカウントのすべてのキーは同じRPMとTPMの予算を共有しています。
より高い限度額の要求
作業量がデフォルトの50RPMや2M TPMを超える必要がある場合は、support@empiriolabs.aiにメールで送ってください:
- アカウントのメールアドレスまたはアカウントIDです
- 必要な制限とその理由
- 予想されるトラフィックパターン(ピークRPM、平均リクエストサイズ)
