Wan 2.6

Wan 2.6
Alibaba Cloud · Video Generation
POST /v1/videos/generations

멀티모달 비디오 생성 모델로, 네이티브 시청각 동기화(립싱크, 대사, 음악, 효과음)를 갖춘 시네마틱한 다중 샷 스토리를 지원합니다.

한눈에

필드가치
모델 IDwan-2-6
모델 출시일2026-01-12
입력 양상텍스트, 이미지, 비디오, 오디오
출력 방식비디오
컨텍스트 윈도우-
무게 정밀도-
지역싱가포르
특징audio_sync, character_consistency, multi_shot
원주민 추론아니
신규아니
지원되는 엔드포인트POST /v1/videos/generations

가격

돌격사양요금
표준 720P초당$0.09 ($0.10였다)
표준 1080P초당$0.138 ($0.15였다)
플래시 720P (오디오)초당$0.045 ($0.050였다)
플래시 720P (오디오 없음)초당$0.0225 ($0.0250였다)
플래시 1080P (오디오)초당$0.069 ($0.0750였다)
플래시 1080P (오디오 없음)초당$0.0345 ($0.03750였다)

예시 요청

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-6", "prompt": "sunrise over the ocean", "duration": 6}'

매개변수

매개변수유형필수기본 설정설명
prompt스트링-장면 설명.
mode열거아니"auto"T2V: text-to-video. i2V: 첨부된 이미지를 애니메이션으로 만드세요. R2V: reference-to-video - 참조 이미지에서 생성하는 것. · 허용: auto, t2v, i2v, r2v
resolution열거아니"1080p"출력 해상도. 더 크면 = 더 높은 충실도지만 느리고 비용이 더 비싸요. · 허용: 720p, 1080p
duration번호아니5클립 길이는 초 단위로 측정됩니다. · 사거리: 5 – 15
aspect_ratio열거아니"16:9"출력 종횡비(1:1, 16:9, 9:16, 4:3, 3:2 등). · 허용: 16:9, 9:16, 1:1, 4:3, 3:4
shot_type열거아니"multi"단일: 한 번의 연속 샷. 멀티: 다중 샷 내러티브. · 허용: single, multi
image스트링아니-참고 이미지 URL. i2v / r2v에 필수입니다.
negative_prompt스트링아니""피해야 할 것들.
seed번호아니-재현성 시드.
audio불리언아니맞아요비디오와 함께 네이티브 오디오를 생성하세요.
flash_mode불리언아니거짓더 빠른 발전과 낮은 비용. i2v와 r2v에만 적용됩니다.
prompt_extend불리언아니맞아요더 나은 결과를 위해 자동으로 프롬프트를 확장하고 다듬으세요.

주석

생성 시간은 5+분 정도 걸릴 수 있습니다. 모드: t2v, i2v (image-to-video), r2v (reference-to-video). 플래시 모드(i2v/r2v 전용) - 더 빠른 생성과 낮은 비용.

이미지 입력

  • 자동 크기 조절: i2v 360-2000px, r2v 240-5000px
  • HEIC/HEIF 자동 변환

참고 영상

  • MP4 또는 MOV
  • 1-30년대
  • 최대 100MB
  • R2V 출력은 10초로 제한됨

선택적 오디오 (t2v / i2v 전용)

  • 3-30MB, 최대 15MB,.mp3 또는.wav
  • r2v에서는 조용히 무시됩니다(오디오는 참조 영상에서 추출됨)

업로드된 미디어 전처리

  • 참고 및 편집 영상은 필요할 때 제공자 호환 MP4로 정규화됩니다.
  • 참조 비디오 지속 시간은 위에 제시된 모드 제한을 따릅니다.

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/wan-2-6.