한계와 API 키 | EmpirioLabs AI Docs

각 계정은 기본 생산 한도를 받으며, 사용량이 증가함에 따라 더 높은 한도를 요청할 수 있습니다. 아래 기본값은 라이브 플랫폼 설정과 동기화되어 있습니다.

기본 계좌 한도

프로덕션 작업 부하에 더 높은 한도가 필요하면 support@empiriolabs.ai로 이메일을 보내세요.

API 키는 sk-empiriolabs- 접두사를 사용합니다:

1 Authorization: Bearer sk-empiriolabs-...

API 키는 서버 쪽에서만 유지하세요. 브라우저 코드, 모바일 앱, 공개 저장소, 클라이언트 로그에 절대 노출하지 마세요.

GPU Cloud 한도는 계좌 범위에 따라 다릅니다. 위에 표시된 기본값은 라이브 플랫폼 설정에서 가져온 것이고, 대시보드 설정 페이지에서는 유효 한도가 표시됩니다.

멀티 GPU 배포는 각 GPU를 한도에 포함시킵니다. 예를 들어, 하나의 2-GPU 인스턴스는 두 개의 GPU 슬롯을 사용합니다. 멈춘 인스턴스는 배치 특성을 유지하며 파괴될 때까지 GPU Cloud 한도에 계속 반영됩니다.

디스크 크기는 인스턴스당 100GB에서 300GB까지 설정할 수 있습니다. GPU를 배포하거나 시작할 때도 초기 실행 창에 충분한 크레딧 잔액이 필요합니다.

호스팅 에이전트 한도는 계정 범위에 따라 결정됩니다. 위에 표시된 기본값은 라이브 플랫폼 설정에서 가져온 것이고, 대시보드 설정 페이지에서는 유효 한도가 표시됩니다.

중지된 호스트 에이전트는 관리 런타임 상태를 유지하며 파괴될 때까지 제한 횟수를 계속 계산합니다. 호스팅 에이전트를 생성하거나 갱신하려면 선택한 월별 플랜에 충분한 신용 잔액이 필요합니다.

Playground는 대화를 자동으로 저장해주어, 나중에 유용한 모델 테스트, 프롬프트, 답변을 다시 볼 수 있습니다.

저장된 플레이그라운드 채팅 기록은 현재 지원되는 채팅 모델과 모드의 텍스트 대화를 포함하고 있습니다. 채팅 대본이 저장되지 않아도 미디어 생성, 검색, 전사, agent/task 및 기타 비텍스트 플레이 플레이 실행 기록을 통해 검토할 수 있습니다.

배경	행동
기본 저장된 채팅 용량	계정당 저장된 채팅 50개
정점 앞에서	새로운 채팅 턴은 여전히 진행되지만, 이전 채팅을 삭제하거나 더 높은 한도를 요청해야 추가 대화가 저장되지 않습니다
공개 API	저장된 채팅을 `GET /v1/playground/conversations` 표시하고 `GET /v1/playground/conversations/\{id\}` 불러오세요

Playground UI는 채팅 헤더에도 상태 칩을 보여줍니다:

칩	의미
`Saved`	최근에 안정된 회전은 유지된다
`Saving`	클라이언트는 600ms 자동 저장 디바운스를 기다리고 있습니다
`Not saving`	계정이 저장된 채팅 한도에 도달해서 새 턴은 계속되지만 저장되지 않습니다

공개 저장된 채팅 API는 읽기 전용입니다. 채팅 저장과 삭제는 여전히 Playground 대시보드에서 이루어집니다.

방법	경로	목적
`GET`	`/v1/playground/conversations`	저장된 대화 목록
`GET`	`/v1/playground/conversations/\{id\}`	메시지가 포함된 저장된 대화 하나 불러오세요

속도 한도를 초과하면 API는 429 Too Many Requests 응답을 반환합니다. 재시도할 때 지터가 있는 지수 백오프를 사용하세요.

속도 제한은 API 키별로 적용되는 것이 아니라 계정별로 적용됩니다. 같은 계정의 모든 키는 동일한 RPM과 TPM 예산을 공유합니다.

작업 부담이 기본 50RPM 또는 2M TPM보다 더 많은 것을 요구한다면, support@empiriolabs.ai 이메일을 보내세요:

코드	의미
`missing_api_key`	소지자 토큰은 제공되지 않았습니다.
`invalid_api_key`	토큰이 변형되었거나, 비활성화되었거나, 만료되었거나, 찾을 수 없습니다.
`insufficient_credits`	해당 계정은 API 호출을 하기 전에 더 많은 크레딧이 필요합니다.
`model_not_found`	요청된 모델은 존재하지 않거나 제공되지 않습니다.
`rate_limit_exceeded`	계정이 RPM 또는 TPM 한도를 초과했습니다. 뒤로 물러서서 다시 시도하세요.
`gpu_limit_exceeded`	계정이 GPU Cloud 한도에 도달했습니다. 인스턴스를 파괴하거나, GPU 수를 줄이거나, 더 높은 한도를 요청하세요.
`agent_limit_reached`	계정이 호스팅 에이전트 한도에 도달했습니다. 사용하지 않는 에이전트를 파괴하거나 더 높은 한도를 요청하세요.
`model_unavailable`	모델의 작업자는 일시적으로 오프라인 상태입니다. 곧 다시 시도하세요.
`upstream_error`	모델 제공자는 오류를 반환했습니다.