Wan 2.6

Alibaba Cloud · Video Generation
POST /v1/videos/generationsदेशी ऑडियो-विजुअल सिंक (लिप-सिंक, संवाद, संगीत, एसएफएक्स) के साथ सिनेमाई, मल्टी-शॉट कहानियों के लिए मल्टीमॉडल वीडियो जनरेशन मॉडल।
एक नजर में
मूल्य निर्धारण
उदाहरण अनुरोध
पैरामीटर
टिप्पणियाँ
पीढ़ी में 5+ मिनट लग सकते हैं। मोड: t2v, i2v (image-to-video), r2v (reference-to-video)। फ्लैश मोड (केवल i2v/r2v) - कम लागत पर तेज़ पीढ़ी।
छवि इनपुट
- ऑटो-रिसाइज़्ड: i2v 360-2000px, r2v 240-5000px
- HEIC/HEIF स्वतः परिवर्तित
संदर्भ वीडियो
- MP4 या MOV
- 1-30 के दशक
- अधिकतम 100 एमबी
- R2V आउटपुट 10s पर छाया हुआ
वैकल्पिक ऑडियो (केवल t2v/i2v)
- 3-30, अधिकतम 15 एमबी,.mp3 या.wav
- r2v में चुपचाप अनदेखा कर दिया गया (इसके बजाय संदर्भ वीडियो से ऑडियो निकाला गया है)
अपलोड किया गया मीडिया प्रीप्रोसेसिंग
- जरूरत पड़ने पर संदर्भ और संपादन वीडियो को प्रदाता-संगत MP4 में सामान्यीकृत किया जाता है।
- संदर्भ-वीडियो अवधि ऊपर दिखाई गई मोड सीमाओं का पालन करती है।
Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/wan-2-6।
