SVI 2.0 Pro

SVI 2.0 Pro
VITA-Group / EPFL · Video Generation
POST /v1/videos/generations

Stable Video Infinity 2.0 Pro on WAN 2.2: extends still images into theoretically infinite-length video while keeping consistent character IDs.

في لمحة

الميدانالقيمة
النموذجsvi-2-0-pro
تاريخ الإفراج النموذجي2025-12-26
طرائق المدخلاتالنص، الصورة
طرائق النواتجVideo
نافذة السياق-
دقة الوزنMixed FP8/BF16
المعالملا نهاية له - حريق -
Native inferenceنعم
جديدةلا
نقاط النهاية المدعومةPOST /v1/videos/generations

الطباعة

الرسمSpecالمعدل
480p Videoالثانية$0.057
720p Videoالثانية$0.17
T2V Fastرسوم إضافية$0.065
T2V Qualityرسوم إضافية$0.13

طلب مثال

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "svi-2-0-pro", "prompt": "sunrise over the ocean", "duration": 6}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
resolutionenumلا"832x480"480p سريع؛ 720p أبطأ لكنه أكثر حدة. · مسموح ب: 832x480، 480x832، 720x1280، 1280x720
durationالعددلا18تقديرات طول الشظايا في ثواني الرنج: 18 - 121.5
cfgالعددلا1.0قوة الالتزام الفوري. الرنج: 1.0 - 2.0
negative_promptسلسلةلا"vibrant tone, overexposed, static, blurry details, subtitles, style, artwork, painting, picture, still, overall gray, worst quality, low quality, JPEG compression residue, ugly, incomplete, extra fingers, poorly drawn hands, poorly drawn face, deformed, disfigured, malformed limbs, fused fingers, still picture, messy background, three legs, background crowd, walking backwards"نص يصف ما يجب تجنبه
t2v_qualityenumلا"quality"مستوى خط أنابيب تحويل النص إلى الفيديو. تستخدم كلمة ‘الجودة’ نموذج صورة مرجعية من Wan 2.2 بالإضافة إلى ذلك لزيادة الدقة؛ يستخدم ‘فاست’ نموذج الفلاش لأجيال أرخص وأسرع. ينطبق فقط في وضع text-to-video (image-to-video يتخطى هذه الخطوة). · مسموح: fast، quality

الحواشي

نظريا، الفيديو بطول لا نهائي مع معرف حرف متسق. عادة ما يعطي الفيديو نتائج أفضل من text-to-video.

** القيود**

  • التوليد يمكن أن يستغرق 45+ دقيقة للفيديو الطويل
  • لأفضل الاقتراحات: وصف الإجراءات المتتالية لكل جزء في عجلتك

** أشكال الصور**

  • (جي بيغ)، (بونغ)، (ويب)، (هيك)، (هيف)، (بومب)، (تيف)

** وضعية مولتيسكان**

  • فعندما يصف عدد من المشاهد في مشهد واحد على وجه السرعة، يعطي النموذج مزيدا من الحرية لتفسير التحولات المميزة للمشاهد
  • Raise CFG (1.5-2.0) when each scene must follow the promptally

مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/svi-2-0-pro.