한계와 API 키

프로덕션 제한, API 키, GPU Cloud, 호스팅 에이전트, 플레이그라운드 저장된 채팅, 증가 요청

각 계정은 기본 생산 한도를 받으며, 사용량이 증가함에 따라 더 높은 한도를 요청할 수 있습니다. 아래 기본값은 라이브 플랫폼 설정과 동기화되어 있습니다.

기본 계좌 한도

한계기본 설정
분당 요청 횟수50 RPM
분당 토큰2,000,000 TPM
계정별 API 키50
계정당 GPU Cloud GPU10
계정별 호스팅 에이전트 수3
계정별로 저장된 놀이터 채팅50

프로덕션 작업 부하에 더 높은 한도가 필요하면 support@empiriolabs.ai로 이메일을 보내세요.

API 키 형식

API 키는 sk-empiriolabs- 접두사를 사용합니다:

1Authorization: Bearer sk-empiriolabs-...

API 키는 서버 쪽에서만 유지하세요. 브라우저 코드, 모바일 앱, 공개 저장소, 클라이언트 로그에 절대 노출하지 마세요.

GPU Cloud 한계

GPU Cloud 한도는 계좌 범위에 따라 다릅니다. 위에 표시된 기본값은 라이브 플랫폼 설정에서 가져온 것이고, 대시보드 설정 페이지에서는 유효 한도가 표시됩니다.

멀티 GPU 배포는 각 GPU를 한도에 포함시킵니다. 예를 들어, 하나의 2-GPU 인스턴스는 두 개의 GPU 슬롯을 사용합니다. 멈춘 인스턴스는 배치 특성을 유지하며 파괴될 때까지 GPU Cloud 한도에 계속 반영됩니다.

디스크 크기는 인스턴스당 100GB에서 300GB까지 설정할 수 있습니다. GPU를 배포하거나 시작할 때도 초기 실행 창에 충분한 크레딧 잔액이 필요합니다.

호스팅 에이전트 제한

호스팅 에이전트 한도는 계정 범위에 따라 결정됩니다. 위에 표시된 기본값은 라이브 플랫폼 설정에서 가져온 것이고, 대시보드 설정 페이지에서는 유효 한도가 표시됩니다.

중지된 호스트 에이전트는 관리 런타임 상태를 유지하며 파괴될 때까지 제한 횟수를 계속 계산합니다. 호스팅 에이전트를 생성하거나 갱신하려면 선택한 월별 플랜에 충분한 신용 잔액이 필요합니다.

API 키 관리

  • 대시보드에서 새 키를 생성하세요
  • 각 계정은 최대 50개의 API 키를 저장할 수 있습니다(조절 가능, 지원팀에 문의 가능).
  • 사용하지 않는 키를 신속히 삭제하여 공격 표면을 줄이세요
  • 환경을 격리하기 위해 프로덕션, 스테이징, 개발에 별도의 키를 사용하세요

저장된 놀이터 채팅

Playground는 대화를 자동으로 저장해주어, 나중에 유용한 모델 테스트, 프롬프트, 답변을 다시 볼 수 있습니다.

저장된 플레이그라운드 채팅 기록은 현재 지원되는 채팅 모델과 모드의 텍스트 대화를 포함하고 있습니다. 채팅 대본이 저장되지 않아도 미디어 생성, 검색, 전사, agent/task 및 기타 비텍스트 플레이 플레이 실행 기록을 통해 검토할 수 있습니다.

배경행동
기본 저장된 채팅 용량계정당 저장된 채팅 50개
정점 앞에서새로운 채팅 턴은 여전히 진행되지만, 이전 채팅을 삭제하거나 더 높은 한도를 요청해야 추가 대화가 저장되지 않습니다
공개 API저장된 채팅을 GET /v1/playground/conversations 표시하고 GET /v1/playground/conversations/\{id\} 불러오세요

Playground UI는 채팅 헤더에도 상태 칩을 보여줍니다:

의미
Saved최근에 안정된 회전은 유지된다
Saving클라이언트는 600ms 자동 저장 디바운스를 기다리고 있습니다
Not saving계정이 저장된 채팅 한도에 도달해서 새 턴은 계속되지만 저장되지 않습니다

공개 저장된 채팅 API는 읽기 전용입니다. 채팅 저장과 삭제는 여전히 Playground 대시보드에서 이루어집니다.

방법경로목적
GET/v1/playground/conversations저장된 대화 목록
GET/v1/playground/conversations/\{id\}메시지가 포함된 저장된 대화 하나 불러오세요

속도 제한 행동

속도 한도를 초과하면 API는 429 Too Many Requests 응답을 반환합니다. 재시도할 때 지터가 있는 지수 백오프를 사용하세요.

속도 제한은 API 키별로 적용되는 것이 아니라 계정별로 적용됩니다. 같은 계정의 모든 키는 동일한 RPM과 TPM 예산을 공유합니다.

더 높은 한도 요청

작업 부담이 기본 50RPM 또는 2M TPM보다 더 많은 것을 요구한다면, support@empiriolabs.ai 이메일을 보내세요:

  • 계정 이메일 또는 계정 ID
  • 필요한 한계와 그 이유
  • 예상 트래픽 패턴(최고 RPM과 평균 요청 크기)

일반적인 오류

코드의미
missing_api_key소지자 토큰은 제공되지 않았습니다.
invalid_api_key토큰이 변형되었거나, 비활성화되었거나, 만료되었거나, 찾을 수 없습니다.
insufficient_credits해당 계정은 API 호출을 하기 전에 더 많은 크레딧이 필요합니다.
model_not_found요청된 모델은 존재하지 않거나 제공되지 않습니다.
rate_limit_exceeded계정이 RPM 또는 TPM 한도를 초과했습니다. 뒤로 물러서서 다시 시도하세요.
gpu_limit_exceeded계정이 GPU Cloud 한도에 도달했습니다. 인스턴스를 파괴하거나, GPU 수를 줄이거나, 더 높은 한도를 요청하세요.
agent_limit_reached계정이 호스팅 에이전트 한도에 도달했습니다. 사용하지 않는 에이전트를 파괴하거나 더 높은 한도를 요청하세요.
model_unavailable모델의 작업자는 일시적으로 오프라인 상태입니다. 곧 다시 시도하세요.
upstream_error모델 제공자는 오류를 반환했습니다.