Wan 2.6

Wan 2.6
Alibaba Cloud · Video Generation
POST /v1/videos/generations

:: نموذج متعدد الوسائط لتوليد الفيديو للقصص السينمائية المتعددة الطلقات مع مزامنة سمعية بصرية محلية (نظام الشفاه، الحوار، الموسيقى، SFX).

في لمحة

الميدانالقيمة
النموذجwan-2-6
تاريخ الإفراج النموذجي2026-01-12
طرائق المدخلاتالنص، التصوير، الفيديو، أوديو
طرائق النواتجVideo
نافذة السياق-
دقة الوزن-
المنطقةسنغافورة
المعالمالصوت -السيك، الشخصية -التوافق، متعدد الطلقات
Native inferenceلا
جديدةلا
نقاط النهاية المدعومةPOST /v1/videos/generations

الطباعة

الرسمSpecالمعدل
المعيار 720Pالثانية$0.09 (كان $0.10)
المعيار 1080Pالثانية$0.138 (كان $0.15)
Flash 720P (audio)الثانية$0.045 (كان $0.050)
Flash 720P (no audio)الثانية$0.0225 (كان $0.0250)
Flash 1080P (audio)الثانية$0.069 (كان $0.0750)
Flash 1080P (no audio)الثانية$0.0345 (كان $0.03750)

طلب مثال

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-6", "prompt": "sunrise over the ocean", "duration": 6}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
promptسلسلةنعم-وصف المشهد
modeenumلا"auto"T2V: text-to-video. I2V: تحريك الصورة المرفقة. r2v: reference-to-video - تولد من صورة مرجعية. · مسموح ب: auto، t2v، i2v، r2v
resolutionenumلا"1080p"دقة الإخراج. أكبر = دقة أعلى لكنها أبطأ / أغلى. · مسموح: 720p، 1080p
durationالعددلا5طول الشفاه في ثواني الرنج: 5 - 15
aspect_ratioenumلا"16:9"نسبة العرض إلى الارتفاع في الإخراج (1:1، 16:9، 9:16، 4:3، 3:2، إلخ). · مسموح ب: 16:9، 9:16، 1:1، 4:3، 3:4
shot_typeenumلا"multi"منفرد: لقطة واحدة مستمرة. متعدد: سرد متعدد اللقطات. · مسموح: single، multi
imageسلسلةلا-صورة مرجعية مطلوبة من طراز i2v/ r2v.
negative_promptسلسلةلا""ما الذي يجب تجنبه
seedالعددلا-بذور التكاثر
audiobooleanلاصحيحتولد الصوت المحلي بالفيديو
flash_modebooleanلاكاذبالتوليد السريع بتكلفة مخفضة يُطبّقُ إلى i2v و r2v فقط.
prompt_extendbooleanلاصحيح:: توسيع نطاق العمل آليا وصقل السبيل إلى تحقيق نتائج أفضل.

الحواشي

الجيل قد يستغرق 5 دقائق Modes: t2v, i2v (image-to-video), r2v (reference-to-video). Flash Mode (i2v/r2v فقط) - faster generation at reduced cost.

** مدخلات رمزية**

  • Auto-resized: i2v 360-2000px, r2v 240-5000px
  • HEIC/HEIF auto-converted

** أشرطة فيديو للإحالة**

  • MP4 أو MOV
  • 1-30
  • Max 100 MB
  • مجمّع ناتج من طراز R2v في 10

** مسموع مؤقت (ت2v/ i2v فقط)**

  • 3-30s, max 15 MB,.mp3 or.wav
  • تم تجاهله بصمت في R2v (يستخرج من الفيديو المرجعي بدلا من ذلك)

** المعالجة المسبقة لوسائط الإعلام المشغولة**

  • ويتم تطبيع أشرطة الفيديو المرجعية والتحريرية بحيث تتوافق مع برنامج إم بي 4 عند الحاجة.
  • وتتَّبع مدة البيانات المرجعية حدود النمط المبينة أعلاه.

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/wan-2-6.