SVI 2.0 Pro | EmpirioLabs AI Docs

POST /v1/videos/generations

WAN 2.2 上的稳定视频无限 2.0 Pro：将静态图像扩展为理论上无限长的视频，同时保持字符ID一致。

一眼看

场地	价值
型号ID	`svi-2-0-pro`
车型发布日期	2025-12-26
输入模态	文本，图片
输出模态	视频
上下文窗口	-
重量精度	混合FP8/BF16/FP16
特色	infinite_length，character_consistency
本土推断	是的
新	不
支持的端点	`POST /v1/videos/generations`

定价

冲锋	规格	速率
480p视频	每秒	$0.057
720p视频	每秒	$0.17
T2V 快速	附加费用	$0.065
T2V质量	附加费用	$0.13

示例请求

$ curl https://api.empiriolabs.ai/v1/videos/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "svi-2-0-pro", "prompt": "sunrise over the ocean", "duration": 6}'

参数

参数	类型	必修	默认	描述
`resolution`	枚举	不	`"832x480"`	480p很快;720p虽然更慢但更清晰。·允许：`832x480`，`480x832`，`720x1280`，`1280x720`
`duration`	人数	不	`18`	估计弹夹长度以秒计。·范围：18 – 121.5
`cfg`	人数	不	`1.0`	迅速增强依从性。·范围：1.0 – 2.0
`negative_prompt`	弦	不	`"vibrant tone, overexposed, static, blurry details, subtitles, style, artwork, painting, picture, still, overall gray, worst quality, low quality, JPEG compression residue, ugly, incomplete, extra fingers, poorly drawn hands, poorly drawn face, deformed, disfigured, malformed limbs, fused fingers, still picture, messy background, three legs, background crowd, walking backwards"`	描述应避免的部分。
`t2v_quality`	枚举	不	`"quality"`	文本转视频流水线层级。“质量”使用Wan 2.2 plus参考图像模型以实现更高保真度;“快速”采用闪存模型，实现更便宜、更快的代际开发。只适用于text-to-video模式（image-to-video跳过这一步）。·允许：`fast`，`quality`

注释

理论上，视频长度无限且字符ID一致。图像到视频通常比text-to-video更优。

约束条件

长视频生成可能需要45+分钟
为了获得最佳动作：在提示中描述每个片段的连续动作

图像格式

jpg、jpeg、png、webp、heic、heif、bmp、tiff、tif

多场景模式

在一个提示中描述多个场景时，较低的CFG（1.0-1.3）使模型更自由地解释不同的场景转换
当每个场景必须字面上遵循提示时，提高CFG（1.5-2.0）

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/svi-2-0-pro。