SVI 2.0 Pro

SVI 2.0 Pro
VITA-Group / EPFL · Video Generation
POST /v1/videos/generations

WAN 2.2 上的稳定视频无限 2.0 Pro:将静态图像扩展为理论上无限长的视频,同时保持字符ID一致。

一眼看

场地价值
型号IDsvi-2-0-pro
车型发布日期2025-12-26
输入模态文本,图片
输出模态视频
上下文窗口-
重量精度混合FP8/BF16/FP16
特色infinite_length,character_consistency
本土推断是的
支持的端点POST /v1/videos/generations

定价

冲锋规格速率
480p视频每秒$0.057
720p视频每秒$0.17
T2V 快速附加费用$0.065
T2V质量附加费用$0.13

示例请求

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "svi-2-0-pro", "prompt": "sunrise over the ocean", "duration": 6}'

参数

参数类型必修默认描述
resolution枚举"832x480"480p很快;720p虽然更慢但更清晰。·允许:832x480480x832720x12801280x720
duration人数18估计弹夹长度以秒计。·范围:18 – 121.5
cfg人数1.0迅速增强依从性。·范围:1.0 – 2.0
negative_prompt"vibrant tone, overexposed, static, blurry details, subtitles, style, artwork, painting, picture, still, overall gray, worst quality, low quality, JPEG compression residue, ugly, incomplete, extra fingers, poorly drawn hands, poorly drawn face, deformed, disfigured, malformed limbs, fused fingers, still picture, messy background, three legs, background crowd, walking backwards"描述应避免的部分。
t2v_quality枚举"quality"文本转视频流水线层级。“质量”使用Wan 2.2 plus参考图像模型以实现更高保真度;“快速”采用闪存模型,实现更便宜、更快的代际开发。只适用于text-to-video模式(image-to-video跳过这一步)。·允许:fastquality

注释

理论上,视频长度无限且字符ID一致。图像到视频通常比text-to-video更优。

约束条件

  • 长视频生成可能需要45+分钟
  • 为了获得最佳动作:在提示中描述每个片段的连续动作

图像格式

  • jpg、jpeg、png、webp、heic、heif、bmp、tiff、tif

多场景模式

  • 在一个提示中描述多个场景时,较低的CFG(1.0-1.3)使模型更自由地解释不同的场景转换
  • 当每个场景必须字面上遵循提示时,提高CFG(1.5-2.0)

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/svi-2-0-pro