MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generationsنموذج مؤسسة ” مو ” المفتوحة المصدر 32B الذي يولد فيديو متزامناً وصوتاً في خطوة واحدة إلى الأمام مع نظام شفاه دقيق ذي بُعدين.
في لمحة
الطباعة
طلب مثال
البارامترات
الحواشي
32B-parameter MoE with coincidehronized lip-sync video + audio in a single inference.
** القيود**
- قد يستغرق الجيل 20 دقيقة
- عادة ما تعطي الصورة إلى فيديو نتائج أفضل على text-to-video
- فقط صورة واحدة مدعومة (مستخدمة كإطار أول)
- مدخلات الفيديو
** أشكال الصور**
- (جي بيغ)، (جي بيغ)، (بانغ)، (ويب)، (هيك)، (هيف)، (بومب)
مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio.
