Limits und API-Schlüssel
Limits und API-Schlüssel
Produktionsgrenzen, API-Schlüssel, GPU Cloud, gehostete Agenten, gespeicherte Chats auf dem Spielplatz und Erhöhung von Anfragen
Jedes Konto erhält Standardproduktionslimits und kann höhere Limits beantragen, wenn die Nutzung steigt. Die untenstehenden Standardeinstellungen werden mit den Live-Plattform-Einstellungen synchronisiert.
Standard-Kontolimits
Schreiben Sie eine E-Mail an support@empiriolabs.ai, wenn Sie höhere Limits für Produktionsworkloads benötigen.
API-Schlüsselformat
API-Schlüssel verwenden das sk-empiriolabs--Präfix:
Behalten Sie die API-Schlüssel nur serverseitig. Stellen Sie sie niemals in Browsercode, mobilen Apps, öffentlichen Repositorien oder Client-Logs frei.
GPU Cloud Grenzen
GPU Cloud Limits sind account-scoped. Die oben gezeigte Standardeinstellung stammt aus den Live-Plattform-Einstellungen, und die Dashboard-Einstellungsseite zeigt dein effektives Limit an.
Bei Multi-GPU-Deployments wird jede GPU als Limit angerechnet. Zum Beispiel verwendet eine 2-GPU-Instanz zwei GPU-Slots. Gestoppte Instanzen behalten ihre Einsatz-Spezialisierung und zählen weiter zum GPU Cloud-Limit, bis sie zerstört werden.
Die Festplattengröße kann pro Instanz von 100 GB bis 300 GB eingestellt werden. Das Deployen oder Starten einer GPU erfordert auch genug Guthaben für das anfängliche Laufzeitfenster.
Limits für gehostete Agenten
Die Limits für gehostete Agenten sind account-scoped. Die oben gezeigte Standardeinstellung stammt aus den Live-Plattform-Einstellungen, und die Dashboard-Einstellungsseite zeigt dein effektives Limit an.
Gestoppte gehostete Agenten behalten ihren Managed-Runtime-Status und zählen weiter zum Limit, bis sie zerstört werden. Die Erstellung oder Verlängerung eines gehosteten Agenten erfordert genügend Guthaben für den ausgewählten Monatsplan.
Verwaltung von API-Schlüsseln
- Neue Schlüssel vom Dashboard generieren
- Jedes Konto kann bis zu 50 API-Schlüssel speichern (verstellbar, Kontakt zum Support)
- Lösche ungenutzte Schlüssel umgehend, um deine Angriffsfläche zu verringern
- Verwenden Sie separate Schlüssel für Produktion, Staging und Entwicklung, um Umgebungen zu isolieren
Spielplatz-Chats gespeichert
Der Playground speichert Gespräche automatisch, sodass Sie später zu nützlichen Modelltests, Prompts und Antworten zurückkehren können.
Der gespeicherte Playground-Chatverlauf umfasst derzeit Textgespräche für unterstützte Chatmodelle und -modi. Mediengenerierung, Suche, Transkription, agent/task und andere nicht-textbasierte Playground-Durchläufe können auch dann über den Nutzungsverlauf überprüft werden, wenn kein Chat-Transkript gespeichert ist.
Die Spielplatz-Benutzeroberfläche zeigt außerdem einen Statuschip im Chat-Header an:
Die öffentliche gespeicherte Chat-API ist schreibgeschützt. Das Speichern und Löschen von Chats erfolgt weiterhin im Dashboard Playground.
Verhalten der Geschwindigkeitsbegrenzung
Wenn Sie ein Rate-Limit überschreiten, gibt die API eine 429 Too Many Requests Antwort zurück. Benutze exponentiellen Backoff mit Jitter, wenn du es erneut versuchst.
Ratenbeschränkungen werden pro Konto angewendet, nicht pro API-Schlüssel. Alle Schlüssel auf demselben Konto teilen sich das gleiche RPM- und TPM-Budget.
Beantragung höherer Grenzen
Wenn Ihre Arbeitsbelastung mehr als die Standard-50 U/min oder 2M TPM erfordert, senden Sie eine E-Mail an support@empiriolabs.ai mit:
- Ihre Konto-E-Mail oder Konto-ID
- Die Grenzen, die du brauchst, und warum
- Erwartete Verkehrsmuster (Spitzendrehzahl, durchschnittliche Anfragegröße)
