Wan 2.6

Wan 2.6
Alibaba Cloud · Video Generation
POST /v1/videos/generations

多模态视频生成模型,用于电影感、多镜头故事,并配备原生视听同步(口型同步、对白、音乐、音效)。

一眼看

场地价值
型号IDwan-2-6
车型发布日期2026-01-12
输入模态文本、图像、视频、音频
输出模态视频
上下文窗口-
重量精度-
地区新加坡
特色audio_sync,好,character_consistency,multi_shot
本土推断
支持的端点POST /v1/videos/generations

定价

冲锋规格速率
标准720P每秒$0.09(曾经$0.10)
标准1080P每秒$0.138(曾经$0.15)
Flash 720P(音频)每秒$0.045(曾经$0.050)
闪存720P(无音频)每秒$0.0225(曾经$0.0250)
Flash 1080P(音频)每秒$0.069(曾经$0.0750)
闪存1080P(无音频)每秒$0.0345(曾经$0.03750)

示例请求

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-6", "prompt": "sunrise over the ocean", "duration": 6}'

参数

参数类型必修默认描述
prompt是的-场景描述。
mode枚举"auto"T2V:text-to-video。I2V:制作附图动画。R2V:reference-to-video - 从参考图像生成。·允许:autot2vi2vr2v
resolution枚举"1080p"输出分辨率。更大 = 保真度更高,但速度慢/成本更高。·允许:720p1080p
duration人数5剪辑长度只需几秒。·范围:5 – 15
aspect_ratio枚举"16:9"输出宽高比(1:1、16:9、9:16、4:3、3:2等)。·允许:16:99:161:14:33:4
shot_type枚举"multi"单镜头:连续拍摄。多镜头:多镜头叙事。·允许:singlemulti
image-参考图片网址。I2V / R2V 是必需的。
negative_prompt""要避免什么。
seed人数-可重复性种子。
audio布尔值确实如此用视频生成原生音频。
flash_mode布尔值错误更快的发电,成本更低。仅适用于i2v和r2v。
prompt_extend布尔值确实如此自动展开并细化提示词以获得更好的效果。

注释

生成可能需要5+分钟。模式:t2v,i2v(image-to-video),r2v(reference-to-video)。闪光模式(仅限i2v/r2v) - - 更快的生成速度且成本更低。

图像输入

  • 自动调整大小:i2v 360-2000px,r2v 240-5000px
  • HEIC/HEIF 自动变形

参考视频

  • MP4 或 MOV
  • 1-30
  • 最大 100 MB
  • R2V 输出限制在 10 秒

可选音频(仅限t2v / i2v)

  • 3-30MB,最大15MB,.mp3或.wav
  • 在r2v中被无声忽略(音频是从参考视频中提取的)

上传的媒体预处理

  • 参考和剪辑视频在需要时会归一化为兼容提供商的MP4格式。
  • 参考视频时长遵循上述模式限制。

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/wan-2-6