MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generationsओपन-सोर्स 32B MoE फाउंडेशन मॉडल जो सटीक दोहरे टॉवर लिप-सिंक के साथ एक अनुमान चरण में सिंक्रनाइज़ वीडियो और ऑडियो उत्पन्न करता है।
एक नजर में
मूल्य निर्धारण
उदाहरण अनुरोध
पैरामीटर
टिप्पणियाँ
32B-पैरामीटर MoE सिंक्रनाइज़ लिप-सिंक वीडियो + ऑडियो के साथ एक ही अनुमान में।
बाधाएं
- पीढ़ी में 20+ मिनट लग सकते हैं
- इमेज-टू-वीडियो आमतौर पर text-to-video के लिए बेहतर परिणाम देता है
- केवल 1 छवि समर्थित (पहले फ्रेम के रूप में उपयोग किया जाता है)
- वीडियो इनपुट समर्थित नहीं हैं
छवि प्रारूप
- जेपीजी, जेपीईजी, पीएनजी, वेबपी, एचईआईसी, एचईआईएफ, बीएमपी, टीआईएफएफ, टीआईएफ, जीआईएफ
Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio।
