限制与API密钥
限制与API密钥
生产限制、API密钥、GPU Cloud、托管代理、Playground保存聊天和增加请求
每个账户会获得默认的生产限额,并可随着使用量增长请求更高的限额。以下默认设置与直播平台设置保持一致。
默认账户限制
如果你需要更高的生产工作负载限制,请发送邮件 [support@empiriolabs.ai](mailto:support@empiriolabs.ai)。
API密钥格式
API 密钥使用 sk-empiriolabs- 前缀:
API密钥只放在服务器端。切勿在浏览器代码、移动应用、公共仓库或客户端日志中暴露它们。
GPU Cloud限制
GPU Cloud限制是根据账户范围设定的。上面显示的默认数据来自 Live 平台设置,仪表盘设置页面显示的是你的有效限制。
多GPU部署将每个GPU计入极限。例如,一个2-GPU实例使用两个GPU插槽。被阻止的实例保持部署特性,并继续计入GPU Cloud限制,直到被摧毁。
磁盘大小可设置为每个实例100GB至300GB。部署或启动GPU也需要在初始运行窗口内有足够的信用余额。
托管代理限制
托管代理的限制是基于账户范围的。上面显示的默认数据来自 Live 平台设置,仪表盘设置页面显示的是你的有效限制。
被停止的托管代理保持其托管运行时状态,并继续计入限制,直到被销毁。创建或续订托管代理需要为所选月度套餐积累足够的信用余额。
管理API密钥
- 从仪表盘生成新密钥
- 每个账户最多可存储50个API密钥(可调节,请联系支持)
- 及时删除未使用的密钥以减少攻击面
- 使用不同的密钥分别进行生产、预设和开发,以隔离环境
保存的操场聊天
Playground会自动保存对话内容,方便你之后回头查看有用的模型测试、提示和回复。
保存的Playground聊天历史目前涵盖支持的聊天模式和模式的文字对话。即使没有保存聊天记录,Playground 的媒体生成、搜索、转录、写作agent/task及其他非文本运行仍可通过使用历史进行审核。
Playground 界面的聊天首部还显示了一个状态芯片:
公开的保存聊天 API 是只读的。保存和删除聊天仍然在 Playground 仪表盘中进行。
速率限制行为
当你超过速率限制时,API 会返回429 Too Many Requests响应。重试时用带抖动的指数后退。
速率限制是按账户设定的,而不是按API密钥。同一账户的所有密钥共享相同的RPM和TPM预算。
请求更高的限额
如果你的工作量需要超过默认的50转或200万TPM,请通过电子邮件发送[support@empiriolabs.ai](mailto:support@empiriolabs.ai):
- 你的账户邮箱或账户ID
- 你需要的限制以及原因
- 预期流量模式(峰值转速、平均请求大小)
