Wan 2.6

Alibaba Cloud · Video Generation
POST /v1/videos/generationsMultimodales Videoerzeugungsmodell für filmatische, mehrfach aufgenommene Geschichten mit nativer Audio-Visual-Synchronisation (Lippensynchronisation, Dialog, Musik, SFX).
Auf einen Blick
Preisgestaltung
Beispielanfrage
Parameter
Anmerkungen
Die Erzeugung kann 5+ Minuten dauern. Modi: t2v, i2v (image-to-video), r2v (reference-to-video). Flash-Modus (nur i2v/r2v) - schnellere Erzeugung zu reduzierten Kosten.
Bildeingaben
- Automatisch verkleinert: i2v 360-2000px, r2v 240-5000px
- HEIC/HEIF automatisch konvertiert
Referenzvideos
- MP4 oder MOV
- 1-30er
- Maximal 100 MB
- R2V-Ausgang begrenzt auf 10 Sekunden
Optionales Audio (nur t2v / i2v)
- 3-30 Sekunden, maximal 15 MB,.mp3 oder.wav
- Still ignoriert in r2v (Audio wird stattdessen aus dem Referenzvideo extrahiert)
Vorverarbeitung hochgeladener Medien
- Referenz- und Bearbeitungsvideos werden bei Bedarf auf anbieterkompatible MP4-Dateien normalisiert.
- Die Referenzvideo-Dauer folgt den oben gezeigten Modusgrenzen.
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/wan-2-6.
