Nova Lite 2

Nova Lite 2
Amazon · Text Generation
POST /v1/chat/completions

快速、经济高效的多模态推理模型,适用于100万上下文下的文本、图片、文档和视频(长文档和~90分钟的片段)。

一眼看

场地价值
型号IDnova-lite-2
车型发布日期2025-12-02
输入模态文本、图片、视频、文档
输出模态正文
上下文窗口1M
重量精度-
最大输出令牌32,000
特色愿景
本土推断
支持的端点POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

定价

冲锋规格速率
输入每100万个提示词标记$0.38
输出每100万个生成代币$3.16
缓存输入每100万个代币$0.2128
网页搜索(Linkup)每次调用时$0.013

示例请求

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "nova-lite-2", "messages": [{"role":"user","content":"Hello"}]}'

参数

参数类型必修默认描述
temperature人数0.7采样温度。0 = 确定性,2 = 最大随机性。·射程:0 – 2
top_p人数0.9核抽样概率质量。低 = 更专注。·射程:0 – 1
max_tokens人数4096回复中最多的代币。·距离:1 – 65536
stop-最多有4串字符串,模型会停止生成更多代币。
enable_reasoning布尔值确实如此启用模型的推理模式。虽然速度较慢,但能改善多步问题。
enable_thinking布尔值确实如此在最终答案前启用扩展推理。enable_reasoning的别名。
reasoning_effort枚举"medium"推理努力程度(低| 中等 | 高)。越高=思考时间越多。·允许:lowmediumhigh
reasoning-响应 API 推理对象: {“effort”:“low|中等
web_search_linkup布尔值错误可选的网页搜索由Linkup提供。启用后,最近的网页源会通过最新的用户消息作为查询检索,并作为额外上下文提供给模型。在模型正常的代币成本基础上,每个请求都增加了固定$0.013。默认为禁用。
disable_formatting布尔值错误启用后,网关不会在使用Linkup网页搜索的助理响应中附加“来源”脚部。当模型输出被传输到另一个不需要装饰的系统时,这很有用。

注释

推理痕迹不会从AWS中暴露。视频上传容量最高可达~1 GB。


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/nova-lite-2