Wan 2.6

Wan 2.6
Alibaba Cloud · Video Generation
POST /v1/videos/generations

Modèle de génération vidéo multimodale pour des histoires cinématographiques à plans multiples avec synchronisation audiovisuelle native (play-sync, dialogues, musique, effets sonores).

En un coup d’œil

TerrainValeur
Identifiant de modèlewan-2-6
Date de sortie du modèle2026-01-12
Modalités d’entréeTexte, Image, Vidéo, Audio
Modalités de sortieVidéo
Fenêtre de contexte-
Précision du poids-
RégionSingapour
Caractéristiquesaudio_sync, character_consistency, multi_shot
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/videos/generations

Tarification

ChargeSpecTaux
720P standardpar seconde$0.09 (était $0.10)
1080P standardpar seconde$0.138 (était $0.15)
Flash 720P (audio)par seconde$0.045 (était $0.050)
Flash 720P (sans audio)par seconde$0.0225 (était $0.0250)
Flash 1080P (audio)par seconde$0.069 (était $0.0750)
Flash 1080P (sans audio)par seconde$0.0345 (était $0.03750)

Exemple de demande

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-6", "prompt": "sunrise over the ocean", "duration": 6}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
promptCordeOui-Description de la scène.
modeenumnon"auto"T2V: text-to-video. i2v: animez l’image jointe. R2V: reference-to-video - générer à partir d’une image de référence. · Autorisé: auto, t2v, i2v, r2v
resolutionenumnon"1080p"Résolution de sortie. Plus grand = plus haute fidélité mais plus lent / plus cher. · Autorisé: 720p, 1080p
durationNombrenon5Longueur du clip en secondes. · Plage: 5 – 15
aspect_ratioenumnon"16:9"Rapport d’aspect de sortie (1:1, 16:9, 9:16, 4:3, 3:2, etc.). · Autorisé: 16:9, 9:16, 1:1, 4:3, 3:4
shot_typeenumnon"multi"Un seul: un tir continu. Multi: Récit à plusieurs plans. · Autorisé: single, multi
imageCordenon-URL de référence de l’image. Nécessaire pour l’i2v / r2v.
negative_promptCordenon""Quoi éviter.
seedNombrenon-Graine de reproductibilité.
audioBooléennonVraiGénérez de l’audio natif avec la vidéo.
flash_modeBooléennonfauxProduction plus rapide à coût réduit. Cela s’applique uniquement à i2v et r2v.
prompt_extendBooléennonVraiDéveloppez et affinez automatiquement l’invite pour obtenir de meilleurs résultats.

Notes

La génération peut prendre 5+ minutes. Modes: T2V, I2V (image-to-video), R2V (reference-to-video). Mode Flash (i2v/r2v uniquement) - génération plus rapide à coût réduit.

Entrées d’images

  • Auto-redimensionné: i2v 360-2000px, r2v 240-5000px
  • HEIC/HEIF conversion automatique

Vidéos de référence

  • MP4 ou MOV
  • 1-30
  • Max 100 MB
  • Sortie R2V limitée à 10 secondes

Audio optionnel (t2v / i2v uniquement)

  • 3-30 livres, maximum 15 Mo,.mp3 ou.wav
  • Ignoré silencieusement en r2v (l’audio est extrait à la place de la vidéo de référence)

Prétraitement média téléchargé

  • Les vidéos de référence et de montage sont normalisées en MP4 compatibles avec le fournisseur lorsque cela est nécessaire.
  • La durée de la vidéo de référence suit les limites de mode indiquées ci-dessus.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/wan-2-6.