Limits und API-Schlüssel

Produktionsgrenzen, API-Schlüssel, GPU Cloud, gehostete Agenten, gespeicherte Chats auf dem Spielplatz und Erhöhung von Anfragen

Jedes Konto erhält Standardproduktionslimits und kann höhere Limits beantragen, wenn die Nutzung steigt. Die untenstehenden Standardeinstellungen werden mit den Live-Plattform-Einstellungen synchronisiert.

Standard-Kontolimits

GrenzeDefault
Anfragen pro Minute50 U/min
Token pro Minute2.000.000 TPM
API-Schlüssel pro Konto50
GPU Cloud GPUs pro Konto10
Gehostete Agenten pro Konto3
Gespeicherte Spielplatzchats pro Konto50

Schreiben Sie eine E-Mail an support@empiriolabs.ai, wenn Sie höhere Limits für Produktionsworkloads benötigen.

API-Schlüsselformat

API-Schlüssel verwenden das sk-empiriolabs--Präfix:

1Authorization: Bearer sk-empiriolabs-...

Behalten Sie die API-Schlüssel nur serverseitig. Stellen Sie sie niemals in Browsercode, mobilen Apps, öffentlichen Repositorien oder Client-Logs frei.

GPU Cloud Grenzen

GPU Cloud Limits sind account-scoped. Die oben gezeigte Standardeinstellung stammt aus den Live-Plattform-Einstellungen, und die Dashboard-Einstellungsseite zeigt dein effektives Limit an.

Bei Multi-GPU-Deployments wird jede GPU als Limit angerechnet. Zum Beispiel verwendet eine 2-GPU-Instanz zwei GPU-Slots. Gestoppte Instanzen behalten ihre Einsatz-Spezialisierung und zählen weiter zum GPU Cloud-Limit, bis sie zerstört werden.

Die Festplattengröße kann pro Instanz von 100 GB bis 300 GB eingestellt werden. Das Deployen oder Starten einer GPU erfordert auch genug Guthaben für das anfängliche Laufzeitfenster.

Limits für gehostete Agenten

Die Limits für gehostete Agenten sind account-scoped. Die oben gezeigte Standardeinstellung stammt aus den Live-Plattform-Einstellungen, und die Dashboard-Einstellungsseite zeigt dein effektives Limit an.

Gestoppte gehostete Agenten behalten ihren Managed-Runtime-Status und zählen weiter zum Limit, bis sie zerstört werden. Die Erstellung oder Verlängerung eines gehosteten Agenten erfordert genügend Guthaben für den ausgewählten Monatsplan.

Verwaltung von API-Schlüsseln

  • Neue Schlüssel vom Dashboard generieren
  • Jedes Konto kann bis zu 50 API-Schlüssel speichern (verstellbar, Kontakt zum Support)
  • Lösche ungenutzte Schlüssel umgehend, um deine Angriffsfläche zu verringern
  • Verwenden Sie separate Schlüssel für Produktion, Staging und Entwicklung, um Umgebungen zu isolieren

Spielplatz-Chats gespeichert

Der Playground speichert Gespräche automatisch, sodass Sie später zu nützlichen Modelltests, Prompts und Antworten zurückkehren können.

Der gespeicherte Playground-Chatverlauf umfasst derzeit Textgespräche für unterstützte Chatmodelle und -modi. Mediengenerierung, Suche, Transkription, agent/task und andere nicht-textbasierte Playground-Durchläufe können auch dann über den Nutzungsverlauf überprüft werden, wenn kein Chat-Transkript gespeichert ist.

SchauplatzVerhalten
Standard-Speicher-Chat-Cap50 gespeicherte Chats pro Konto
An der KappeNeue Chat-Runden laufen weiterhin, aber zusätzliche Gespräche werden erst gespeichert, wenn man ältere Chats löscht oder ein höheres Limit beantragt
Öffentliche APIBenutze GET /v1/playground/conversations, um gespeicherte Chats aufzulisten, und GET /v1/playground/conversations/\{id\}, um einen zu laden.

Die Spielplatz-Benutzeroberfläche zeigt außerdem einen Statuschip im Chat-Header an:

ChipBedeutung
SavedDie jüngste festgelegte Wendung wird fortgesetzt
SavingDer Client wartet auf das 600-ms-Autosave-Debounce
Not savingDas Konto erreichte das Limit für gespeicherte Chats, sodass neue Züge fortgesetzt werden, aber nicht gespeichert werden

Die öffentliche gespeicherte Chat-API ist schreibgeschützt. Das Speichern und Löschen von Chats erfolgt weiterhin im Dashboard Playground.

MethodeVerlaufZweck
GET/v1/playground/conversationsListe gespeicherter Gespräche
GET/v1/playground/conversations/\{id\}Lade eine gespeicherte Unterhaltung mit Nachrichten

Verhalten der Geschwindigkeitsbegrenzung

Wenn Sie ein Rate-Limit überschreiten, gibt die API eine 429 Too Many Requests Antwort zurück. Benutze exponentiellen Backoff mit Jitter, wenn du es erneut versuchst.

Ratenbeschränkungen werden pro Konto angewendet, nicht pro API-Schlüssel. Alle Schlüssel auf demselben Konto teilen sich das gleiche RPM- und TPM-Budget.

Beantragung höherer Grenzen

Wenn Ihre Arbeitsbelastung mehr als die Standard-50 U/min oder 2M TPM erfordert, senden Sie eine E-Mail an support@empiriolabs.ai mit:

  • Ihre Konto-E-Mail oder Konto-ID
  • Die Grenzen, die du brauchst, und warum
  • Erwartete Verkehrsmuster (Spitzendrehzahl, durchschnittliche Anfragegröße)

Häufige Fehler

CodeBedeutung
missing_api_keyEs wurde kein Inhabertoken bereitgestellt.
invalid_api_keyDas Token ist fehlgebildet, inaktiv, abgelaufen oder nicht gefunden.
insufficient_creditsDas Konto benötigt mehr Credits, bevor API-Aufrufe durchgeführt werden können.
model_not_foundDas angeforderte Modell existiert nicht oder ist nicht verfügbar.
rate_limit_exceededDas Konto hat sein RPM- oder TPM-Limit überschritten. Versuchen Sie es erneut mit Rückschritt.
gpu_limit_exceededDas Konto hat sein GPU Cloud Limit erreicht. Eine Instanz zerstören, die GPU-Anzahl reduzieren oder ein höheres Limit anfordern.
agent_limit_reachedDas Konto hat sein Limit für gehostete Agenten erreicht. Zerstöre einen ungenutzten Agent oder fordere eine höhere Grenze an.
model_unavailableDer Mitarbeiter des Modells ist vorübergehend offline. Gleich nochmal versuchen.
upstream_errorDer Modellanbieter hat einen Fehler zurückgegeben.