Wan 2.6

Alibaba Cloud · Video Generation

POST /v1/videos/generations

多模态视频生成模型，用于电影感、多镜头故事，并配备原生视听同步（口型同步、对白、音乐、音效）。

一眼看

场地	价值
型号ID	`wan-2-6`
车型发布日期	2026-01-12
输入模态	文本、图像、视频、音频
输出模态	视频
上下文窗口	-
重量精度	-
地区	新加坡
特色	audio_sync，好，character_consistency，multi_shot
本土推断	不
新	不
支持的端点	`POST /v1/videos/generations`

定价

冲锋	规格	速率
标准720P	每秒	$0.09（曾经$0.10）
标准1080P	每秒	$0.138（曾经$0.15）
Flash 720P（音频）	每秒	$0.045（曾经$0.050）
闪存720P（无音频）	每秒	$0.0225（曾经$0.0250）
Flash 1080P（音频）	每秒	$0.069（曾经$0.0750）
闪存1080P（无音频）	每秒	$0.0345（曾经$0.03750）

示例请求

$ curl https://api.empiriolabs.ai/v1/videos/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "wan-2-6", "prompt": "sunrise over the ocean", "duration": 6}'

参数

参数	类型	必修	默认	描述
`prompt`	弦	是的	-	场景描述。
`mode`	枚举	不	`"auto"`	T2V：text-to-video。I2V：制作附图动画。R2V：reference-to-video - 从参考图像生成。·允许：`auto`，`t2v`，`i2v`，`r2v`
`resolution`	枚举	不	`"1080p"`	输出分辨率。更大 = 保真度更高，但速度慢/成本更高。·允许：`720p`，`1080p`
`duration`	人数	不	`5`	剪辑长度只需几秒。·范围：5 – 15
`aspect_ratio`	枚举	不	`"16:9"`	输出宽高比（1：1、16：9、9：16、4：3、3：2等）。·允许：`16:9`、`9:16`、`1:1`、`4:3`、`3:4`
`shot_type`	枚举	不	`"multi"`	单镜头：连续拍摄。多镜头：多镜头叙事。·允许：`single`，`multi`
`image`	弦	不	-	参考图片网址。I2V / R2V 是必需的。
`negative_prompt`	弦	不	`""`	要避免什么。
`seed`	人数	不	-	可重复性种子。
`audio`	布尔值	不	确实如此	用视频生成原生音频。
`flash_mode`	布尔值	不	错误	更快的发电，成本更低。仅适用于i2v和r2v。
`prompt_extend`	布尔值	不	确实如此	自动展开并细化提示词以获得更好的效果。

注释

生成可能需要5+分钟。模式：t2v，i2v（image-to-video），r2v（reference-to-video）。闪光模式（仅限i2v/r2v） - - 更快的生成速度且成本更低。

图像输入

自动调整大小：i2v 360-2000px，r2v 240-5000px
HEIC/HEIF 自动变形

参考视频

MP4 或 MOV
1-30
最大 100 MB
R2V 输出限制在 10 秒

可选音频（仅限t2v / i2v）

3-30MB，最大15MB，.mp3或.wav
在r2v中被无声忽略（音频是从参考视频中提取的）

上传的媒体预处理

参考和剪辑视频在需要时会归一化为兼容提供商的MP4格式。
参考视频时长遵循上述模式限制。

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/wan-2-6。