Limits und API-Schlüssel | EmpirioLabs AI Docs

Jedes Konto erhält Standardproduktionslimits und kann höhere Limits beantragen, wenn die Nutzung steigt. Die untenstehenden Standardeinstellungen werden mit den Live-Plattform-Einstellungen synchronisiert.

Standard-Kontolimits

Grenze	Default
Anfragen pro Minute	50 U/min
Token pro Minute	2.000.000 TPM
API-Schlüssel pro Konto	50
GPU Cloud GPUs pro Konto	10
Gehostete Agenten pro Konto	3
Gespeicherte Spielplatzchats pro Konto	50

Schreiben Sie eine E-Mail an support@empiriolabs.ai, wenn Sie höhere Limits für Produktionsworkloads benötigen.

API-Schlüsselformat

API-Schlüssel verwenden das sk-empiriolabs--Präfix:

1 Authorization: Bearer sk-empiriolabs-...

Behalten Sie die API-Schlüssel nur serverseitig. Stellen Sie sie niemals in Browsercode, mobilen Apps, öffentlichen Repositorien oder Client-Logs frei.

GPU Cloud Grenzen

GPU Cloud Limits sind account-scoped. Die oben gezeigte Standardeinstellung stammt aus den Live-Plattform-Einstellungen, und die Dashboard-Einstellungsseite zeigt dein effektives Limit an.

Bei Multi-GPU-Deployments wird jede GPU als Limit angerechnet. Zum Beispiel verwendet eine 2-GPU-Instanz zwei GPU-Slots. Gestoppte Instanzen behalten ihre Einsatz-Spezialisierung und zählen weiter zum GPU Cloud-Limit, bis sie zerstört werden.

Die Festplattengröße kann pro Instanz von 100 GB bis 300 GB eingestellt werden. Das Deployen oder Starten einer GPU erfordert auch genug Guthaben für das anfängliche Laufzeitfenster.

Limits für gehostete Agenten

Die Limits für gehostete Agenten sind account-scoped. Die oben gezeigte Standardeinstellung stammt aus den Live-Plattform-Einstellungen, und die Dashboard-Einstellungsseite zeigt dein effektives Limit an.

Gestoppte gehostete Agenten behalten ihren Managed-Runtime-Status und zählen weiter zum Limit, bis sie zerstört werden. Die Erstellung oder Verlängerung eines gehosteten Agenten erfordert genügend Guthaben für den ausgewählten Monatsplan.

Verwaltung von API-Schlüsseln

Neue Schlüssel vom Dashboard generieren
Jedes Konto kann bis zu 50 API-Schlüssel speichern (verstellbar, Kontakt zum Support)
Lösche ungenutzte Schlüssel umgehend, um deine Angriffsfläche zu verringern
Verwenden Sie separate Schlüssel für Produktion, Staging und Entwicklung, um Umgebungen zu isolieren

Spielplatz-Chats gespeichert

Der Playground speichert Gespräche automatisch, sodass Sie später zu nützlichen Modelltests, Prompts und Antworten zurückkehren können.

Der gespeicherte Playground-Chatverlauf umfasst derzeit Textgespräche für unterstützte Chatmodelle und -modi. Mediengenerierung, Suche, Transkription, agent/task und andere nicht-textbasierte Playground-Durchläufe können auch dann über den Nutzungsverlauf überprüft werden, wenn kein Chat-Transkript gespeichert ist.

Schauplatz	Verhalten
Standard-Speicher-Chat-Cap	50 gespeicherte Chats pro Konto
An der Kappe	Neue Chat-Runden laufen weiterhin, aber zusätzliche Gespräche werden erst gespeichert, wenn man ältere Chats löscht oder ein höheres Limit beantragt
Öffentliche API	Benutze `GET /v1/playground/conversations`, um gespeicherte Chats aufzulisten, und `GET /v1/playground/conversations/\{id\}`, um einen zu laden.

Die Spielplatz-Benutzeroberfläche zeigt außerdem einen Statuschip im Chat-Header an:

Chip	Bedeutung
`Saved`	Die jüngste festgelegte Wendung wird fortgesetzt
`Saving`	Der Client wartet auf das 600-ms-Autosave-Debounce
`Not saving`	Das Konto erreichte das Limit für gespeicherte Chats, sodass neue Züge fortgesetzt werden, aber nicht gespeichert werden

Die öffentliche gespeicherte Chat-API ist schreibgeschützt. Das Speichern und Löschen von Chats erfolgt weiterhin im Dashboard Playground.

Methode	Verlauf	Zweck
`GET`	`/v1/playground/conversations`	Liste gespeicherter Gespräche
`GET`	`/v1/playground/conversations/\{id\}`	Lade eine gespeicherte Unterhaltung mit Nachrichten

Verhalten der Geschwindigkeitsbegrenzung

Wenn Sie ein Rate-Limit überschreiten, gibt die API eine 429 Too Many Requests Antwort zurück. Benutze exponentiellen Backoff mit Jitter, wenn du es erneut versuchst.

Ratenbeschränkungen werden pro Konto angewendet, nicht pro API-Schlüssel. Alle Schlüssel auf demselben Konto teilen sich das gleiche RPM- und TPM-Budget.

Beantragung höherer Grenzen

Wenn Ihre Arbeitsbelastung mehr als die Standard-50 U/min oder 2M TPM erfordert, senden Sie eine E-Mail an support@empiriolabs.ai mit:

Ihre Konto-E-Mail oder Konto-ID
Die Grenzen, die du brauchst, und warum
Erwartete Verkehrsmuster (Spitzendrehzahl, durchschnittliche Anfragegröße)

Häufige Fehler

Code	Bedeutung
`missing_api_key`	Es wurde kein Inhabertoken bereitgestellt.
`invalid_api_key`	Das Token ist fehlgebildet, inaktiv, abgelaufen oder nicht gefunden.
`insufficient_credits`	Das Konto benötigt mehr Credits, bevor API-Aufrufe durchgeführt werden können.
`model_not_found`	Das angeforderte Modell existiert nicht oder ist nicht verfügbar.
`rate_limit_exceeded`	Das Konto hat sein RPM- oder TPM-Limit überschritten. Versuchen Sie es erneut mit Rückschritt.
`gpu_limit_exceeded`	Das Konto hat sein GPU Cloud Limit erreicht. Eine Instanz zerstören, die GPU-Anzahl reduzieren oder ein höheres Limit anfordern.
`agent_limit_reached`	Das Konto hat sein Limit für gehostete Agenten erreicht. Zerstöre einen ungenutzten Agent oder fordere eine höhere Grenze an.
`model_unavailable`	Der Mitarbeiter des Modells ist vorübergehend offline. Gleich nochmal versuchen.
`upstream_error`	Der Modellanbieter hat einen Fehler zurückgegeben.