Wan 2.7

Wan 2.7
Alibaba Cloud · Video Generation
POST /v1/videos/generations

Modèle vidéo multimodal supportant T2V, I2V, le montage vidéo et reference-to-video, avec une sortie haute fidélité provenant de texte, d’image ou d’entrées vidéo.

En un coup d’œil

TerrainValeur
Identifiant de modèlewan-2-7
Date de sortie du modèle2026-04-26
Modalités d’entréeTexte, Image, Vidéo, Audio
Modalités de sortieVidéo
Fenêtre de contexte-
Précision du poids-
RégionSingapour
Caractéristiquesaudio_sync, character_consistency, multi_shot
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/videos/generations

Tarification

ChargeSpecTaux
Tous les modes 720Ppar seconde$0.10
Tous les modes 1080Ppar seconde$0.150

Exemple de demande

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-7", "prompt": "sunrise over the ocean", "duration": 6}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
promptCordeOui-Description de la scène.
modeenumnon"auto"T2V: text-to-video. i2v: animez l’image jointe. Édition vidéo: Édition de la vidéo jointe. R2V: reference-to-video. · Autorisés: auto, t2v, i2v, videoedit, r2v
resolutionenumnon"1080p"Résolution de sortie. Plus grand = plus haute fidélité mais plus lent / plus cher. · Autorisé: 720p, 1080p
durationNombrenon5Longueur du clip en secondes. · Répartition: 2 – 15
aspect_ratioenumnon-Optionnel. Si elle est omise, le modèle choisit en fonction de l’entrée. · Autorisé: 16:9, 9:16, 1:1, 4:3, 3:4
imageCordenon-URL de référence de l’image. Indispensable pour i2v / r2v / vidéomontage.
videoCordenon-Référence à l’URL de la vidéo. Nécessaire pour le montage vidéo / r2v.
negative_promptCordenon""Quoi éviter.
seedNombrenon-Graine de reproductibilité.
audio_settingenumnon"auto"Auto: Générer de l’audio natif. Origine: conservez l’audio de la vidéo de référence (videoedit/r2v uniquement). · Autorisé: auto, origin
prompt_extendBooléennonVraiDéveloppez et affinez automatiquement l’invite pour obtenir de meilleurs résultats.

Notes

La génération peut prendre 30+ minutes. Les modes sont détectés automatiquement à partir des pièces jointes - ou surpassent avec le paramètre mode.

Modes

  • T2V: pas d’attaches
  • I2V (Première image): 1 image
  • I2V (Premier + Dernier): exactement 2 images
  • Suite I2V: 1 vidéo (2-10 secondes) + image optionnelle de la dernière image
  • Édition vidéo: 1 vidéo (2-10 secondes, ≤100 Mo, MP4/MOV) + jusqu’à 3 images de référence
  • R2V: jusqu’à 5 références combinées; Référez les sujets dans votre consigne avec Video1, Image1, etc.

Audio optionnel

  • T2V/I2V: 2-30 ans
  • R2V: 1-10s (utilisé comme échantillon de timbre vocal)
  • Max 15 Mo,.mp3 ou.wav

Facturation

  • Le montage vidéo et le R2V sont facturés pour la durée combinée d’entrée + sortie.

Prétraitement média téléchargé

  • Les vidéos de référence et de montage sont normalisées en MP4 compatibles avec le fournisseur lorsque cela est nécessaire.
  • La durée de la vidéo de référence suit les limites de mode indiquées ci-dessus.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/wan-2-7.