Wan 2.6

Alibaba Cloud · Video Generation
POST /v1/videos/generations멀티모달 비디오 생성 모델로, 네이티브 시청각 동기화(립싱크, 대사, 음악, 효과음)를 갖춘 시네마틱한 다중 샷 스토리를 지원합니다.
한눈에
가격
예시 요청
매개변수
주석
생성 시간은 5+분 정도 걸릴 수 있습니다. 모드: t2v, i2v (image-to-video), r2v (reference-to-video). 플래시 모드(i2v/r2v 전용) - 더 빠른 생성과 낮은 비용.
이미지 입력
- 자동 크기 조절: i2v 360-2000px, r2v 240-5000px
- HEIC/HEIF 자동 변환
참고 영상
- MP4 또는 MOV
- 1-30년대
- 최대 100MB
- R2V 출력은 10초로 제한됨
선택적 오디오 (t2v / i2v 전용)
- 3-30MB, 최대 15MB,.mp3 또는.wav
- r2v에서는 조용히 무시됩니다(오디오는 참조 영상에서 추출됨)
업로드된 미디어 전처리
- 참고 및 편집 영상은 필요할 때 제공자 호환 MP4로 정규화됩니다.
- 참조 비디오 지속 시간은 위에 제시된 모드 제한을 따릅니다.
Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/wan-2-6.
