Límites y claves API | EmpirioLabs AI Docs

Cada cuenta recibe límites de producción por defecto y puede solicitar límites más altos a medida que el uso crece. Los valores predeterminados que aparecen a continuación se mantienen sincronizados con la configuración de la plataforma en vivo.

Límites predeterminados de la cuenta

Límite	Default
Solicitudes por minuto	50 RPM
Fichas por minuto	2.000.000 TPM
Claves API por cuenta	50
GPU Cloud GPU por cuenta	10
Agentes alojados por cuenta	3
Chats guardados en el patio de recreo por cuenta	50

Envía un correo a support@empiriolabs.ai si necesitas límites más altos para las cargas de producción.

Formato de clave API

Las claves API utilizan el prefijo sk-empiriolabs-:

1 Authorization: Bearer sk-empiriolabs-...

Mantén las claves API solo en el lado del servidor. Nunca los expongas en el código del navegador, aplicaciones móviles, repositorios públicos o registros de clientes.

GPU Cloud límites

GPU Cloud límites están definidos por el alcance de la cuenta. El valor predeterminado mostrado arriba proviene de la configuración en vivo de la plataforma, y la página de configuración del panel muestra tu límite efectivo.

Los despliegues multi-GPU cuentan cada GPU hasta el límite. Por ejemplo, una instancia de 2 GPU usa dos ranuras para GPU. Las instancias detenidas mantienen su especificación de despliegue y continúan contando hasta el límite de GPU Cloud hasta que son destruidas.

El tamaño del disco puede ajustarse de 100 GB a 300 GB por instancia. Desplegar o arrancar una GPU también requiere suficiente saldo de créditos para la ventana inicial de ejecución.

Límites de agentes alojados

Los límites de agentes alojados están asignados al alcance de la cuenta. El valor predeterminado mostrado arriba proviene de la configuración en vivo de la plataforma, y la página de configuración del panel muestra tu límite efectivo.

Los agentes alojados detenidos mantienen su estado de ejecución gestionado y continúan contando hasta el límite hasta que son destruidos. Crear o renovar un agente alojado requiere suficiente saldo crediticio para el plan mensual seleccionado.

Gestión de claves API

Generar nuevas claves desde el panel de control
Cada cuenta puede contener hasta 50 claves API (ajustable, contacta con soporte)
Elimina las teclas no utilizadas rápidamente para reducir tu superficie de ataque
Utiliza claves separadas para producción, staging y desarrollo para aislar los entornos

Chats guardados en el patio de recreo

El Playground guarda automáticamente las conversaciones para que puedas volver a pruebas útiles de modelos, prompts y respuestas más adelante.

El historial de chat guardado de Playground cubre actualmente las conversaciones de texto para modelos y modos de chat compatibles. La generación, búsqueda, transcripción, agent/task y otras ejecuciones de Playground no textuales pueden revisarse a través del historial de uso incluso cuando no se guarda la transcripción del chat.

Ambientación	Comportamiento
Límite predeterminado de chat guardado	50 chats guardados por cuenta
En la gorra	Siguen ocurriendo nuevos turnos de chat, pero las conversaciones adicionales no se guardan hasta que borras chats antiguos o pides un límite más alto
API pública	Usa `GET /v1/playground/conversations` para listar los chats guardados y `GET /v1/playground/conversations/\{id\}` para cargar uno

La interfaz de Playground también muestra un chip de estado en la cabecera del chat:

Chip	Significado
`Saved`	Se mantiene el último giro asentado
`Saving`	El cliente está esperando el rebote de guardado automático de 600 ms
`Not saving`	La cuenta alcanzó el límite de chat guardado, así que los nuevos turnos continúan pero no se almacenan

La API de chat guardado público es de solo lectura. Guardar y eliminar chats sigue ocurriendo en el panel de control de Playground.

Método	Camino	Propósito
`GET`	`/v1/playground/conversations`	Lista de conversaciones guardadas
`GET`	`/v1/playground/conversations/\{id\}`	Carga una conversación guardada con mensajes

Comportamiento del límite de tasa

Cuando superas un límite de tasa, la API devuelve una respuesta 429 Too Many Requests. Usa retroceso exponencial con jitter al volver a intentarlo.

Los límites de tasa se aplican por cuenta, no por clave de API. Todas las claves de la misma cuenta comparten el mismo presupuesto de RPM y TPM.

Solicitar límites más altos

Si tu carga de trabajo requiere más que las 50 RPM o 2M TPM por defecto, envía un correo a support@empiriolabs.ai con:

Tu correo electrónico o ID de cuenta
Los límites que necesitas y por qué
Patrones de tráfico esperados (RPM pico, tamaño medio de la solicitud)

Errores comunes

Código	Significado
`missing_api_key`	No se proporcionó ningún testimonio de portador.
`invalid_api_key`	El token está malformado, inactivo, caducado o no encontrado.
`insufficient_credits`	La cuenta necesita más créditos antes de hacer llamadas a la API.
`model_not_found`	El modelo solicitado no existe o no está disponible.
`rate_limit_exceeded`	La cuenta ha superado su límite de RPM o TPM. Inténtalo de nuevo con retroceso.
`gpu_limit_exceeded`	La cuenta ha alcanzado su límite de GPU Cloud. Destruye una instancia, reduce el número de GPU o solicita un límite más alto.
`agent_limit_reached`	La cuenta ha alcanzado su límite de agentes alojados. Destruye un agente no utilizado o solicita un límite más alto.
`model_unavailable`	El trabajador del modelo está temporalmente fuera de línea. Inténtalo de nuevo en breve.
`upstream_error`	El proveedor del modelo devolvió un error.