MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generationsModelo de fundação MoE 32B de código aberto que gera vídeo e áudio sincronizados em uma única etapa de inferência, com sincronização labial precisa de duas torres.
De um olhar
Precificação
Exemplo de pedido
Parâmetros
Notas
MoE de 32B parâmetros com sincronização labial sincronizada de vídeo + áudio em uma única inferência.
Restrições
- A geração pode levar 20+ minutos
- Imagem-para-vídeo normalmente gera resultados superiores aos text-to-video
- Apenas 1 imagem suportada (usada como primeiro quadro)
- Entradas de vídeo NÃO suportadas
Formatos de imagem
- jpg, jpeg, png, webp, heic, heif, bmp, tiff, tif, gif
Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio.
