MOSS Video and Audio | EmpirioLabs AI Docs

OpenMOSS · Video Generation

POST /v1/videos/generations

ओपन-सोर्स 32B MoE फाउंडेशन मॉडल जो सटीक दोहरे टॉवर लिप-सिंक के साथ एक अनुमान चरण में सिंक्रनाइज़ वीडियो और ऑडियो उत्पन्न करता है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`moss-video-and-audio`
मॉडल रिलीज की तारीख	2026-01-29
इनपुट तौर-तरीके	पाठ, छवि
आउटपुट के तौर-तरीके	वीडियो, ऑडियो
संदर्भ विंडो	-
वजन परिशुद्धता	-
सुविधाऐं	audio_sync, लिपसिंक
मूल अनुमान	हाँ
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/videos/generations`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
360p वीडियो	प्रति वीडियो	$0.17
720p वीडियो	प्रति वीडियो	$2.82
T2V फास्ट	अतिरिक्त शुल्क	$0.065
T2V गुणवत्ता	अतिरिक्त शुल्क	$0.13

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/videos/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "moss-video-and-audio", "prompt": "sunrise over the ocean", "duration": 6}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`prompt`	तार	हाँ	-	दृश्य विवरण। संलग्न छवि के साथ, एक image-to-video संकेत बन जाता है।
`mode`	एनम	नहीं	`"t2v"`	T2V: शुद्ध text-to-video। i2v: संलग्न छवि को एनिमेट करें। · अनुमति: `t2v`, `i2v`
`resolution`	एनम	नहीं	`"720p"`	720p एक अलग उच्च-वीआरएएम समापन बिंदु का उपयोग करता है। · अनुमति: `360p`, `720p`
`aspect_ratio`	एनम	नहीं	`"landscape"`	काई केवल परिदृश्य का समर्थन करता है (16:9) और चित्र (9:16). · अनुमति: `landscape`, `portrait`
`duration`	संख्या	नहीं	`8`	सेकंड में क्लिप की लंबाई। अपस्ट्रीम मॉडल 8s पर हार्ड-कैप्ड है। · रेंज: 2 - 8
`t2v_quality`	एनम	नहीं	`"quality"`	केवल टेक्स्ट-टू-वीडियो। ~ 2× गति के लिए तेजी से निष्ठा का व्यापार करता है। · अनुमति: `fast`, `quality`
`num_inference_steps`	संख्या	नहीं	`25`	प्रसार चरण। अधिक = उच्च निष्ठा, धीमी। · रेंज: 10 - 50
`cfg_scale`	संख्या	नहीं	`5.0`	क्लासिफायर-मुक्त मार्गदर्शन। उच्च = संकेत का अधिक सख्ती से पालन करता है। · रेंज: 1.0 - 10.0
`sigma_shift`	संख्या	नहीं	`5.0`	शेड्यूल शिफ्ट। केवल तभी मान्य जब रिज़ॉल्यूशन=360p। · रेंज: 1.0 - 10.0
`image`	तार	नहीं	-	i2v मोड के लिए संदर्भ छवि URL।
`negative_prompt`	तार	नहीं	`""`	क्या परहेज करें।
`seed`	संख्या	नहीं	-	प्रजनन क्षमता बीज।

पीढ़ी में 20+ मिनट लग सकते हैं
इमेज-टू-वीडियो आमतौर पर text-to-video के लिए बेहतर परिणाम देता है
केवल 1 छवि समर्थित (पहले फ्रेम के रूप में उपयोग किया जाता है)
वीडियो इनपुट समर्थित नहीं हैं

छवि प्रारूप

जेपीजी, जेपीईजी, पीएनजी, वेबपी, एचईआईसी, एचईआईएफ, बीएमपी, टीआईएफएफ, टीआईएफ, जीआईएफ

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ