한계와 API 키
한계와 API 키
프로덕션 제한, API 키, GPU Cloud, 호스팅 에이전트, 플레이그라운드 저장된 채팅, 증가 요청
각 계정은 기본 생산 한도를 받으며, 사용량이 증가함에 따라 더 높은 한도를 요청할 수 있습니다. 아래 기본값은 라이브 플랫폼 설정과 동기화되어 있습니다.
기본 계좌 한도
프로덕션 작업 부하에 더 높은 한도가 필요하면 support@empiriolabs.ai로 이메일을 보내세요.
API 키 형식
API 키는 sk-empiriolabs- 접두사를 사용합니다:
API 키는 서버 쪽에서만 유지하세요. 브라우저 코드, 모바일 앱, 공개 저장소, 클라이언트 로그에 절대 노출하지 마세요.
GPU Cloud 한계
GPU Cloud 한도는 계좌 범위에 따라 다릅니다. 위에 표시된 기본값은 라이브 플랫폼 설정에서 가져온 것이고, 대시보드 설정 페이지에서는 유효 한도가 표시됩니다.
멀티 GPU 배포는 각 GPU를 한도에 포함시킵니다. 예를 들어, 하나의 2-GPU 인스턴스는 두 개의 GPU 슬롯을 사용합니다. 멈춘 인스턴스는 배치 특성을 유지하며 파괴될 때까지 GPU Cloud 한도에 계속 반영됩니다.
디스크 크기는 인스턴스당 100GB에서 300GB까지 설정할 수 있습니다. GPU를 배포하거나 시작할 때도 초기 실행 창에 충분한 크레딧 잔액이 필요합니다.
호스팅 에이전트 제한
호스팅 에이전트 한도는 계정 범위에 따라 결정됩니다. 위에 표시된 기본값은 라이브 플랫폼 설정에서 가져온 것이고, 대시보드 설정 페이지에서는 유효 한도가 표시됩니다.
중지된 호스트 에이전트는 관리 런타임 상태를 유지하며 파괴될 때까지 제한 횟수를 계속 계산합니다. 호스팅 에이전트를 생성하거나 갱신하려면 선택한 월별 플랜에 충분한 신용 잔액이 필요합니다.
API 키 관리
- 대시보드에서 새 키를 생성하세요
- 각 계정은 최대 50개의 API 키를 저장할 수 있습니다(조절 가능, 지원팀에 문의 가능).
- 사용하지 않는 키를 신속히 삭제하여 공격 표면을 줄이세요
- 환경을 격리하기 위해 프로덕션, 스테이징, 개발에 별도의 키를 사용하세요
저장된 놀이터 채팅
Playground는 대화를 자동으로 저장해주어, 나중에 유용한 모델 테스트, 프롬프트, 답변을 다시 볼 수 있습니다.
저장된 플레이그라운드 채팅 기록은 현재 지원되는 채팅 모델과 모드의 텍스트 대화를 포함하고 있습니다. 채팅 대본이 저장되지 않아도 미디어 생성, 검색, 전사, agent/task 및 기타 비텍스트 플레이 플레이 실행 기록을 통해 검토할 수 있습니다.
Playground UI는 채팅 헤더에도 상태 칩을 보여줍니다:
공개 저장된 채팅 API는 읽기 전용입니다. 채팅 저장과 삭제는 여전히 Playground 대시보드에서 이루어집니다.
속도 제한 행동
속도 한도를 초과하면 API는 429 Too Many Requests 응답을 반환합니다. 재시도할 때 지터가 있는 지수 백오프를 사용하세요.
속도 제한은 API 키별로 적용되는 것이 아니라 계정별로 적용됩니다. 같은 계정의 모든 키는 동일한 RPM과 TPM 예산을 공유합니다.
더 높은 한도 요청
작업 부담이 기본 50RPM 또는 2M TPM보다 더 많은 것을 요구한다면, support@empiriolabs.ai 이메일을 보내세요:
- 계정 이메일 또는 계정 ID
- 필요한 한계와 그 이유
- 예상 트래픽 패턴(최고 RPM과 평균 요청 크기)
