Wan 2.6

Wan 2.6
Alibaba Cloud · Video Generation
POST /v1/videos/generations

देशी ऑडियो-विजुअल सिंक (लिप-सिंक, संवाद, संगीत, एसएफएक्स) के साथ सिनेमाई, मल्टी-शॉट कहानियों के लिए मल्टीमॉडल वीडियो जनरेशन मॉडल।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीwan-2-6
मॉडल रिलीज की तारीख2026-01-12
इनपुट तौर-तरीकेपाठ, छवि, वीडियो, ऑडियो
आउटपुट के तौर-तरीकेवीडियो
संदर्भ विंडो-
वजन परिशुद्धता-
क्षेत्रसिंगापुर
सुविधाऐंaudio_sync, character_consistency, multi_shot
मूल अनुमाननहीं
नयानहीं
समर्थित समापन बिंदुPOST /v1/videos/generations

मूल्य निर्धारण

आवेशित करनायुक्तिदर
मानक 720 पीप्रति सेकंड$0.09 ($0.10 था)
मानक 1080पीप्रति सेकंड$0.138 ($0.15 था)
फ्लैश 720P (ऑडियो)प्रति सेकंड$0.045 ($0.050 था)
फ्लैश 720P (कोई ऑडियो नहीं)प्रति सेकंड$0.0225 ($0.0250 था)
फ्लैश 1080P (ऑडियो)प्रति सेकंड$0.069 ($0.0750 था)
फ्लैश 1080P (कोई ऑडियो नहीं)प्रति सेकंड$0.0345 ($0.03750 था)

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-6", "prompt": "sunrise over the ocean", "duration": 6}'

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
promptतारहाँ-दृश्य विवरण।
modeएनमनहीं"auto"टी2वी: text-to-video। i2v: संलग्न छवि को एनिमेट करें। R2V: reference-to-video - एक संदर्भ छवि से उत्पन्न करें। · अनुमति: auto, t2v, i2v, r2v
resolutionएनमनहीं"1080p"आउटपुट रिज़ॉल्यूशन। बड़ा = उच्च निष्ठा लेकिन धीमी/अधिक महंगी। · अनुमति: 720p, 1080p
durationसंख्यानहीं5सेकंड में क्लिप की लंबाई। · रेंज: 5 - 15
aspect_ratioएनमनहीं"16:9"आउटपुट पहलू अनुपात (1:1, 16:9, 9:16, 4:3, 3:2, आदि)। · अनुमति: 16:9, 9:16, 1:1, 4:3, 3:4
shot_typeएनमनहीं"multi"एकल: एक निरंतर शॉट। बहु: मल्टी-शॉट कथा। · अनुमति: single, multi
imageतारनहीं-संदर्भ छवि URL. i2v/r2v के लिए आवश्यक।
negative_promptतारनहीं""क्या परहेज करें।
seedसंख्यानहीं-प्रजनन क्षमता बीज।
audioबूलियननहींसचवीडियो के साथ देशी ऑडियो उत्पन्न करें।
flash_modeबूलियननहींगलतकम लागत पर तेजी से उत्पादन। केवल i2v और r2v पर लागू होता है।
prompt_extendबूलियननहींसचबेहतर परिणामों के लिए प्रॉम्प्ट को स्वचालित रूप से विस्तारित और परिष्कृत करें।

टिप्पणियाँ

पीढ़ी में 5+ मिनट लग सकते हैं। मोड: t2v, i2v (image-to-video), r2v (reference-to-video)। फ्लैश मोड (केवल i2v/r2v) - कम लागत पर तेज़ पीढ़ी।

छवि इनपुट

  • ऑटो-रिसाइज़्ड: i2v 360-2000px, r2v 240-5000px
  • HEIC/HEIF स्वतः परिवर्तित

संदर्भ वीडियो

  • MP4 या MOV
  • 1-30 के दशक
  • अधिकतम 100 एमबी
  • R2V आउटपुट 10s पर छाया हुआ

वैकल्पिक ऑडियो (केवल t2v/i2v)

  • 3-30, अधिकतम 15 एमबी,.mp3 या.wav
  • r2v में चुपचाप अनदेखा कर दिया गया (इसके बजाय संदर्भ वीडियो से ऑडियो निकाला गया है)

अपलोड किया गया मीडिया प्रीप्रोसेसिंग

  • जरूरत पड़ने पर संदर्भ और संपादन वीडियो को प्रदाता-संगत MP4 में सामान्यीकृत किया जाता है।
  • संदर्भ-वीडियो अवधि ऊपर दिखाई गई मोड सीमाओं का पालन करती है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/wan-2-6