Wan 2.7

Alibaba Cloud · Video Generation

POST /v1/videos/generations

Modèle vidéo multimodal supportant T2V, I2V, le montage vidéo et reference-to-video, avec une sortie haute fidélité provenant de texte, d’image ou d’entrées vidéo.

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`wan-2-7`
Date de sortie du modèle	2026-04-26
Modalités d’entrée	Texte, Image, Vidéo, Audio
Modalités de sortie	Vidéo
Fenêtre de contexte	-
Précision du poids	-
Région	Singapour
Caractéristiques	audio_sync, character_consistency, multi_shot
Inférence autochtone	Non
Nouveau	Non
Points de terminaison pris en charge	`POST /v1/videos/generations`

Tarification

Charge	Spec	Taux
Tous les modes 720P	par seconde	$0.10
Tous les modes 1080P	par seconde	$0.150

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/videos/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "wan-2-7", "prompt": "sunrise over the ocean", "duration": 6}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`prompt`	Corde	Oui	-	Description de la scène.
`mode`	enum	non	`"auto"`	T2V: text-to-video. i2v: animez l’image jointe. Édition vidéo: Édition de la vidéo jointe. R2V: reference-to-video. · Autorisés: `auto`, `t2v`, `i2v`, `videoedit`, `r2v`
`resolution`	enum	non	`"1080p"`	Résolution de sortie. Plus grand = plus haute fidélité mais plus lent / plus cher. · Autorisé: `720p`, `1080p`
`duration`	Nombre	non	`5`	Longueur du clip en secondes. · Répartition: 2 – 15
`aspect_ratio`	enum	non	-	Optionnel. Si elle est omise, le modèle choisit en fonction de l’entrée. · Autorisé: `16:9`, `9:16`, `1:1`, `4:3`, `3:4`
`image`	Corde	non	-	URL de référence de l’image. Indispensable pour i2v / r2v / vidéomontage.
`video`	Corde	non	-	Référence à l’URL de la vidéo. Nécessaire pour le montage vidéo / r2v.
`negative_prompt`	Corde	non	`""`	Quoi éviter.
`seed`	Nombre	non	-	Graine de reproductibilité.
`audio_setting`	enum	non	`"auto"`	Auto: Générer de l’audio natif. Origine: conservez l’audio de la vidéo de référence (videoedit/r2v uniquement). · Autorisé: `auto`, `origin`
`prompt_extend`	Booléen	non	Vrai	Développez et affinez automatiquement l’invite pour obtenir de meilleurs résultats.

Notes

La génération peut prendre 30+ minutes. Les modes sont détectés automatiquement à partir des pièces jointes - ou surpassent avec le paramètre mode.

Modes

T2V: pas d’attaches
I2V (Première image): 1 image
I2V (Premier + Dernier): exactement 2 images
Suite I2V: 1 vidéo (2-10 secondes) + image optionnelle de la dernière image
Édition vidéo: 1 vidéo (2-10 secondes, ≤100 Mo, MP4/MOV) + jusqu’à 3 images de référence
R2V: jusqu’à 5 références combinées; Référez les sujets dans votre consigne avec Video1, Image1, etc.

Audio optionnel

T2V/I2V: 2-30 ans
R2V: 1-10s (utilisé comme échantillon de timbre vocal)
Max 15 Mo,.mp3 ou.wav

Facturation

Le montage vidéo et le R2V sont facturés pour la durée combinée d’entrée + sortie.

Prétraitement média téléchargé

Les vidéos de référence et de montage sont normalisées en MP4 compatibles avec le fournisseur lorsque cela est nécessaire.
La durée de la vidéo de référence suit les limites de mode indiquées ci-dessus.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/wan-2-7.