MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generationsModelo base MoE 32B de código abierto que genera vídeo y audio sincronizados en un solo paso de inferencia con sincronización labial precisa de doble torre.
A simple vista
Precios
Solicitud de ejemplo
Parámetros
Notas
MoE de 32B parámetros con sincronización labial de vídeo + audio sincronizados en una sola inferencia.
Restricciones
- La generación puede tardar 20+ minutos
- La imagen a vídeo suele dar resultados superiores a text-to-video
- Solo 1 imagen soportada (usada como primer fotograma)
- Entradas de vídeo NO soportadas
Formatos de imagen
- jpg, jpeg, png, webp, heic, heif, bmp, tiff, tif, gif
Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio.
