MOSS Video and Audio

OpenMOSS · Video Generation
POST /v1/videos/generations정밀한 듀얼 타워 립싱크와 함께 한 추론 단계에서 동기화된 비디오와 오디오를 생성하는 오픈 소스 32B MoE 기초 모델입니다.
한눈에
가격
예시 요청
매개변수
주석
32B 매개변수 MoE와 동기화된 립싱크 비디오 + 오디오를 단일 추론으로 제공합니다.
제약 조건
- 생성 시간은 20+분일 수 있습니다
- 이미지-비디오 변환은 일반적으로 text-to-video보다 더 우수한 결과를 제공합니다
- 지원되는 이미지는 단 1장(첫 프레임으로 사용됨)
- 비디오 입력은 지원되지 않습니다
이미지 포맷
- jpg, jpeg, png, webp, heic, heif, BMP, TIFF, TIF, GIF
Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/moss-video-and-audio.
