Límites y claves API

Límites de producción, claves API, GPU Cloud, agentes alojados, chats guardados en playground y solicitudes de aumento

Cada cuenta recibe límites de producción por defecto y puede solicitar límites más altos a medida que el uso crece. Los valores predeterminados que aparecen a continuación se mantienen sincronizados con la configuración de la plataforma en vivo.

Límites predeterminados de la cuenta

LímiteDefault
Solicitudes por minuto50 RPM
Fichas por minuto2.000.000 TPM
Claves API por cuenta50
GPU Cloud GPU por cuenta10
Agentes alojados por cuenta3
Chats guardados en el patio de recreo por cuenta50

Envía un correo a support@empiriolabs.ai si necesitas límites más altos para las cargas de producción.

Formato de clave API

Las claves API utilizan el prefijo sk-empiriolabs-:

1Authorization: Bearer sk-empiriolabs-...

Mantén las claves API solo en el lado del servidor. Nunca los expongas en el código del navegador, aplicaciones móviles, repositorios públicos o registros de clientes.

GPU Cloud límites

GPU Cloud límites están definidos por el alcance de la cuenta. El valor predeterminado mostrado arriba proviene de la configuración en vivo de la plataforma, y la página de configuración del panel muestra tu límite efectivo.

Los despliegues multi-GPU cuentan cada GPU hasta el límite. Por ejemplo, una instancia de 2 GPU usa dos ranuras para GPU. Las instancias detenidas mantienen su especificación de despliegue y continúan contando hasta el límite de GPU Cloud hasta que son destruidas.

El tamaño del disco puede ajustarse de 100 GB a 300 GB por instancia. Desplegar o arrancar una GPU también requiere suficiente saldo de créditos para la ventana inicial de ejecución.

Límites de agentes alojados

Los límites de agentes alojados están asignados al alcance de la cuenta. El valor predeterminado mostrado arriba proviene de la configuración en vivo de la plataforma, y la página de configuración del panel muestra tu límite efectivo.

Los agentes alojados detenidos mantienen su estado de ejecución gestionado y continúan contando hasta el límite hasta que son destruidos. Crear o renovar un agente alojado requiere suficiente saldo crediticio para el plan mensual seleccionado.

Gestión de claves API

  • Generar nuevas claves desde el panel de control
  • Cada cuenta puede contener hasta 50 claves API (ajustable, contacta con soporte)
  • Elimina las teclas no utilizadas rápidamente para reducir tu superficie de ataque
  • Utiliza claves separadas para producción, staging y desarrollo para aislar los entornos

Chats guardados en el patio de recreo

El Playground guarda automáticamente las conversaciones para que puedas volver a pruebas útiles de modelos, prompts y respuestas más adelante.

El historial de chat guardado de Playground cubre actualmente las conversaciones de texto para modelos y modos de chat compatibles. La generación, búsqueda, transcripción, agent/task y otras ejecuciones de Playground no textuales pueden revisarse a través del historial de uso incluso cuando no se guarda la transcripción del chat.

AmbientaciónComportamiento
Límite predeterminado de chat guardado50 chats guardados por cuenta
En la gorraSiguen ocurriendo nuevos turnos de chat, pero las conversaciones adicionales no se guardan hasta que borras chats antiguos o pides un límite más alto
API públicaUsa GET /v1/playground/conversations para listar los chats guardados y GET /v1/playground/conversations/\{id\} para cargar uno

La interfaz de Playground también muestra un chip de estado en la cabecera del chat:

ChipSignificado
SavedSe mantiene el último giro asentado
SavingEl cliente está esperando el rebote de guardado automático de 600 ms
Not savingLa cuenta alcanzó el límite de chat guardado, así que los nuevos turnos continúan pero no se almacenan

La API de chat guardado público es de solo lectura. Guardar y eliminar chats sigue ocurriendo en el panel de control de Playground.

MétodoCaminoPropósito
GET/v1/playground/conversationsLista de conversaciones guardadas
GET/v1/playground/conversations/\{id\}Carga una conversación guardada con mensajes

Comportamiento del límite de tasa

Cuando superas un límite de tasa, la API devuelve una respuesta 429 Too Many Requests. Usa retroceso exponencial con jitter al volver a intentarlo.

Los límites de tasa se aplican por cuenta, no por clave de API. Todas las claves de la misma cuenta comparten el mismo presupuesto de RPM y TPM.

Solicitar límites más altos

Si tu carga de trabajo requiere más que las 50 RPM o 2M TPM por defecto, envía un correo a support@empiriolabs.ai con:

  • Tu correo electrónico o ID de cuenta
  • Los límites que necesitas y por qué
  • Patrones de tráfico esperados (RPM pico, tamaño medio de la solicitud)

Errores comunes

CódigoSignificado
missing_api_keyNo se proporcionó ningún testimonio de portador.
invalid_api_keyEl token está malformado, inactivo, caducado o no encontrado.
insufficient_creditsLa cuenta necesita más créditos antes de hacer llamadas a la API.
model_not_foundEl modelo solicitado no existe o no está disponible.
rate_limit_exceededLa cuenta ha superado su límite de RPM o TPM. Inténtalo de nuevo con retroceso.
gpu_limit_exceededLa cuenta ha alcanzado su límite de GPU Cloud. Destruye una instancia, reduce el número de GPU o solicita un límite más alto.
agent_limit_reachedLa cuenta ha alcanzado su límite de agentes alojados. Destruye un agente no utilizado o solicita un límite más alto.
model_unavailableEl trabajador del modelo está temporalmente fuera de línea. Inténtalo de nuevo en breve.
upstream_errorEl proveedor del modelo devolvió un error.