MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generationsEin Open-Source-32B MoE-Foundation-Modell, das synchronisiertes Video und Audio in einem Inferenzschritt mit präziser Dual-Tower-Lippensynchronisation erzeugt.
Auf einen Blick
Preisgestaltung
Beispielanfrage
Parameter
Anmerkungen
32B-Parameter MoE mit synchronisiertem Lip-Sync-Video + Audio in einer einzigen Inferenz.
Einschränkungen
- Die Erzeugung kann 20+ Minuten dauern
- Bild-zu-Video liefert in der Regel bessere Ergebnisse als text-to-video
- Nur ein Bild wurde unterstützt (als erster Frame verwendet)
- Videoeingänge werden NICHT unterstützt
Bildformate
- jpg, jpeg, png, webp, heic, heif, bmp, tiff, tif, gif
Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio.
