Wan 2.6

Alibaba Cloud · Video Generation
POST /v1/videos/generationsネイティブの視聴覚同期(リップシンク、セリフ、音楽、SFX)を備えたシネマティックでマルチショットのマルチモーダルビデオ生成モデル。
一目で
価格設定
例示リクエスト
パラメータ
注記
生成には5+分かかることもあります。モード:t2v、i2v(image-to-video)、r2v(reference-to-video)。フラッシュモード(i2v/r2vのみ) - より高速で低コストで生成が可能。
画像入力
- 自動リサイズ:i2v 360-2000px、r2v 240-5000px
- HEIC/HEIF自動変換
参考動画
- MP4またはMOV
- 1-30
- 最大100MB
- R2V出力は10秒に制限
オプション音声(t2v / i2vのみ)
- 3〜30MB、最大15MB、.mp3または.wav
- r2vでは静かに無視されます(音声は参照映像から抽出されます)
アップロードされたメディアの前処理
- 参照動画や編集動画は必要に応じてプロバイダー対応のMP4に正規化されます。
- 参照映像の持続時間は上記のモード制限に従います。
Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/wan-2-6。
