Wan 2.6

Wan 2.6
Alibaba Cloud · Video Generation
POST /v1/videos/generations

ネイティブの視聴覚同期(リップシンク、セリフ、音楽、SFX)を備えたシネマティックでマルチショットのマルチモーダルビデオ生成モデル。

一目で

フィールド価値
モデルIDwan-2-6
モデル発売日2026-01-12
入力モダリティテキスト、画像、映像、音声
出力モダリティビデオ
コンテキストウィンドウ-
重量精度-
地域シンガポール
特徴audio_sync、character_consistency、multi_shot
ネイティブ推論いいえ
新作いいえ
サポート端末POST /v1/videos/generations

価格設定

チャージスペックレート
標準720P秒単位$0.09(だった$0.10)
標準1080P秒単位$0.138(だった$0.15)
Flash 720P(オーディオ)秒単位$0.045(だった$0.050)
Flash 720P(音声なし)秒単位$0.0225(だった$0.0250)
Flash 1080P(オーディオ)秒単位$0.069(だった$0.0750)
Flash 1080P(音声なし)秒単位$0.0345(だった$0.03750)

例示リクエスト

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-6", "prompt": "sunrise over the ocean", "duration": 6}'

パラメータ

パラメータ種類必須デフォルト概要
promptストリングはい-シーンの説明。
modeエヌムいいえ"auto"T2V:text-to-video。i2V:添付画像をアニメーション化します。R2V: reference-to-video - 参照画像から生成します。·許可:autot2vi2vr2v
resolutionエヌムいいえ"1080p"出力解像度。大きい=忠実度は高いですが、遅く/コストがかかります。·許可:720p1080p
duration番号いいえ5クリップの長さは秒単位です。·射程:5 – 15
aspect_ratioエヌムいいえ"16:9"出力アスペクト比(1:1、16:9、9:16、4:3、3:2など)。·許可:16:99:161:14:33:4
shot_typeエヌムいいえ"multi"シングル:連続ショット1本。マルチ:マルチショットの物語。·許可:singlemulti
imageストリングいいえ-参考画像のURLをご覧ください。i2v/r2vには必須です。
negative_promptストリングいいえ""避けるべきこと。
seed番号いいえ-再現性シード。
audioブール値いいえ確かに映像と共にネイティブ音声を生成します。
flash_modeブール値いいえ偽りより速い発電を、低コストで実現。これはi2vとr2vにのみ適用されます。
prompt_extendブール値いいえ確かにプロンプトを自動的に展開・調整し、より良い結果が得られます。

注記

生成には5+分かかることもあります。モード:t2v、i2v(image-to-video)、r2v(reference-to-video)。フラッシュモード(i2v/r2vのみ) - より高速で低コストで生成が可能。

画像入力

  • 自動リサイズ:i2v 360-2000px、r2v 240-5000px
  • HEIC/HEIF自動変換

参考動画

  • MP4またはMOV
  • 1-30
  • 最大100MB
  • R2V出力は10秒に制限

オプション音声(t2v / i2vのみ)

  • 3〜30MB、最大15MB、.mp3または.wav
  • r2vでは静かに無視されます(音声は参照映像から抽出されます)

アップロードされたメディアの前処理

  • 参照動画や編集動画は必要に応じてプロバイダー対応のMP4に正規化されます。
  • 参照映像の持続時間は上記のモード制限に従います。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/wan-2-6