Límites y claves API
Límites y claves API
Límites de producción, claves API, GPU Cloud, agentes alojados, chats guardados en playground y solicitudes de aumento
Cada cuenta recibe límites de producción por defecto y puede solicitar límites más altos a medida que el uso crece. Los valores predeterminados que aparecen a continuación se mantienen sincronizados con la configuración de la plataforma en vivo.
Límites predeterminados de la cuenta
Envía un correo a support@empiriolabs.ai si necesitas límites más altos para las cargas de producción.
Formato de clave API
Las claves API utilizan el prefijo sk-empiriolabs-:
Mantén las claves API solo en el lado del servidor. Nunca los expongas en el código del navegador, aplicaciones móviles, repositorios públicos o registros de clientes.
GPU Cloud límites
GPU Cloud límites están definidos por el alcance de la cuenta. El valor predeterminado mostrado arriba proviene de la configuración en vivo de la plataforma, y la página de configuración del panel muestra tu límite efectivo.
Los despliegues multi-GPU cuentan cada GPU hasta el límite. Por ejemplo, una instancia de 2 GPU usa dos ranuras para GPU. Las instancias detenidas mantienen su especificación de despliegue y continúan contando hasta el límite de GPU Cloud hasta que son destruidas.
El tamaño del disco puede ajustarse de 100 GB a 300 GB por instancia. Desplegar o arrancar una GPU también requiere suficiente saldo de créditos para la ventana inicial de ejecución.
Límites de agentes alojados
Los límites de agentes alojados están asignados al alcance de la cuenta. El valor predeterminado mostrado arriba proviene de la configuración en vivo de la plataforma, y la página de configuración del panel muestra tu límite efectivo.
Los agentes alojados detenidos mantienen su estado de ejecución gestionado y continúan contando hasta el límite hasta que son destruidos. Crear o renovar un agente alojado requiere suficiente saldo crediticio para el plan mensual seleccionado.
Gestión de claves API
- Generar nuevas claves desde el panel de control
- Cada cuenta puede contener hasta 50 claves API (ajustable, contacta con soporte)
- Elimina las teclas no utilizadas rápidamente para reducir tu superficie de ataque
- Utiliza claves separadas para producción, staging y desarrollo para aislar los entornos
Chats guardados en el patio de recreo
El Playground guarda automáticamente las conversaciones para que puedas volver a pruebas útiles de modelos, prompts y respuestas más adelante.
El historial de chat guardado de Playground cubre actualmente las conversaciones de texto para modelos y modos de chat compatibles. La generación, búsqueda, transcripción, agent/task y otras ejecuciones de Playground no textuales pueden revisarse a través del historial de uso incluso cuando no se guarda la transcripción del chat.
La interfaz de Playground también muestra un chip de estado en la cabecera del chat:
La API de chat guardado público es de solo lectura. Guardar y eliminar chats sigue ocurriendo en el panel de control de Playground.
Comportamiento del límite de tasa
Cuando superas un límite de tasa, la API devuelve una respuesta 429 Too Many Requests. Usa retroceso exponencial con jitter al volver a intentarlo.
Los límites de tasa se aplican por cuenta, no por clave de API. Todas las claves de la misma cuenta comparten el mismo presupuesto de RPM y TPM.
Solicitar límites más altos
Si tu carga de trabajo requiere más que las 50 RPM o 2M TPM por defecto, envía un correo a support@empiriolabs.ai con:
- Tu correo electrónico o ID de cuenta
- Los límites que necesitas y por qué
- Patrones de tráfico esperados (RPM pico, tamaño medio de la solicitud)
