MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generations开源32B MoE基础模型,通过精确的双塔口型同步,在一次推断步骤内生成同步的视频和音频。
一眼看
定价
示例请求
参数
注释
32B参数的MoE,单次推断同步口型同步视频+音频。
约束条件
- 生成可能需要20+分钟
- 图像转视频通常比text-to-video更优
- 仅支持一张图片(作为第一帧使用)
- 不支持视频输入
图像格式
- jpg、jpeg、png、webp、heic、heif、bmp、tiff、tif、gif
Machine可读模式: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio。
