MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generationsオープンソースの32B MoE基盤モデルで、精密なデュアルタワーリップシンクを用いて、1ステップの推論で同期した映像と音声を生成する。
一目で
価格設定
例示リクエスト
パラメータ
注記
32BパラメータのMoEで、同期したリップシンク映像+音声を単一の推論で実現します。
制約
- 生成には20+分かかることもあります
- 画像から映像への変換は、通常text-to-videoよりも優れた結果をもたらします。
- サポート画像は1枚のみ(最初のフレームとして使用)
- ビデオ入力はサポートされていません
画像フォーマット
- JPG、JPEG、PNG、WEBP、HEIC、HEIF、BMP、TIFF、TIF、GIF
Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio。
