Limites et clés API | EmpirioLabs AI Docs

Chaque compte reçoit des limites de production par défaut et peut demander des limites plus élevées à mesure que l’utilisation augmente. Les paramètres par défaut ci-dessous sont synchronisés avec les paramètres de la plateforme live.

Limites de compte par défaut

Limite	Par défaut
Demandes par minute	50 tours par minute
Jetons par minute	2 000 000 TPM
Clés API par compte	50
GPU Cloud GPU par compte	10
Agents hébergés par compte	3
Discussions de terrain de récréation enregistrées par compte	50

Envoyez un mail à support@empiriolabs.ai si vous avez besoin de limites plus élevées pour les charges de travail en production.

Format de clé API

Les clés API utilisent le préfixe sk-empiriolabs-:

1 Authorization: Bearer sk-empiriolabs-...

Gardez les clés API uniquement côté serveur. Ne les exposez jamais dans le code du navigateur, les applications mobiles, les dépôts publics ou les journaux clients.

GPU Cloud limites

Les limites du GPU Cloud sont limitées par rapport au compte. Le défaut montré ci-dessus provient des paramètres de la plateforme en direct, et la page des paramètres du tableau de bord affiche votre limite effective.

Les déploiements multi-GPU comptent chaque GPU dans la limite. Par exemple, une instance à deux GPU utilise deux emplacements GPU. Les instances arrêtées conservent leur spécification de déploiement et continuent de compter jusqu’à la limite du GPU Cloud jusqu’à ce qu’elles soient détruites.

La taille du disque peut être réglée de 100 Go à 300 Go par instance. Le déploiement ou le démarrage d’un GPU nécessite également un solde de crédits suffisant pour la fenêtre initiale de fonctionnement.

Limites d’agents hébergés

Les limites des agents hébergés sont évaluées par rapport au compte. Le défaut montré ci-dessus provient des paramètres de la plateforme en direct, et la page des paramètres du tableau de bord affiche votre limite effective.

Les agents hébergés arrêtés conservent leur état d’exécution géré et continuent de compter jusqu’à la limite jusqu’à leur destruction. Créer ou renouveler un agent hébergé nécessite un solde de crédit suffisant pour le forfait mensuel sélectionné.

Gestion des clés API

Générer de nouvelles clés à partir du tableau de bord
Chaque compte peut contenir jusqu’à 50 clés API (ajustables, contactez le support)
Supprimez rapidement les touches inutilisées pour réduire votre surface d’attaque
Utilisez des clés séparées pour la production, la mise en scène et le développement afin d’isoler les environnements

Discussions de terrain de récréation sauvegardées

Le Playground sauvegarde automatiquement les conversations afin que vous puissiez revenir plus tard aux tests utiles du modèle, aux prompts et aux réponses.

L’historique de discussion Playground enregistré couvre actuellement les conversations textuelles pour les modèles et modes de chat pris en charge. La génération de médias, la recherche, la transcription, la agent/task et d’autres exécutions Playground non textuelles peuvent toujours être consultées via l’historique d’utilisation même sans sauvegarde de transcription du chat.

Cadre	Comportement
Limite par défaut de chat sauvegardé	50 chats sauvegardés par compte
À la casquette	Les nouveaux tours de chat continuent de s’afficher, mais les conversations supplémentaires ne sont pas sauvegardées tant que vous n’avez pas supprimé les anciennes discussions ou demandé une limite plus élevée
API publique	Utilisez `GET /v1/playground/conversations` pour lister les discussions sauvegardées et `GET /v1/playground/conversations/\{id\}` pour en charger une

L’interface de Playground affiche également une puce d’état dans l’en-tête du chat:

Chip	Signification
`Saved`	Le dernier tournant stabilisé est maintenu
`Saving`	Le client attend le rebond automatique de 600 ms
`Not saving`	Le compte a atteint le plafond de chat sauvegardé, donc les nouveaux tours continuent mais ne sont pas stockés

L’API de chat sauvegardé publique est en lecture seule. Sauvegarder et supprimer les discussions se fait toujours dans le tableau de bord Playground.

Méthode	Chemin	Objectif
`GET`	`/v1/playground/conversations`	Liste des conversations sauvegardées
`GET`	`/v1/playground/conversations/\{id\}`	Chargez une conversation sauvegardée avec des messages

Comportement de la limite de taux

Lorsque vous dépassez une limite de vitesse, l’API renvoie une réponse 429 Too Many Requests. Utilisez un retour exponentiel avec le jitter lors de la réessaie.

Les limites de taux sont appliquées par compte, pas par clé API. Toutes les clés sur le même compte partagent le même budget RPM et TPM.

Demande de limites plus élevées

Si votre charge de travail nécessite plus que le 50 RPM par défaut ou 2 millions de TPM, envoyez un e-mail à support@empiriolabs.ai avec:

Votre adresse e-mail ou votre identifiant de compte
Les limites dont vous avez besoin et pourquoi
Schémas de trafic attendus (RPM de pointe, taille moyenne de la requête)

Erreurs courantes

Code	Signification
`missing_api_key`	Aucun jeton de porteur n’a été fourni.
`invalid_api_key`	Le jeton est déformé, inactif, expiré ou non retrouvé.
`insufficient_credits`	Le compte a besoin de plus de crédits avant de passer des appels API.
`model_not_found`	Le modèle demandé n’existe pas ou n’est pas disponible.
`rate_limit_exceeded`	Le compte a dépassé sa limite de RPM ou TPM. Essaie à nouveau avec un recul.
`gpu_limit_exceeded`	Le compte a atteint sa limite de GPU Cloud. Détruire une instance, réduire le nombre de GPU, ou demander une limite plus élevée.
`agent_limit_reached`	Le compte a atteint sa limite d’agents hébergés. Détruire un agent inutilisé ou demander une limite plus élevée.
`model_unavailable`	L’employé du modèle est temporairement hors ligne. Réessayez bientôt.
`upstream_error`	Le fournisseur de modèles a renvoyé une erreur.