Wan 2.7

Wan 2.7
Alibaba Cloud · Video Generation
POST /v1/videos/generations

Modelo de vídeo multimodal suportando T2V, I2V, edição de vídeo e reference-to-video, com saída de alta fidelidade a partir de entradas, texto, imagem ou vídeo.

De um olhar

CampoValor
ID do modelowan-2-7
Data de lançamento do modelo2026-04-26
Modalidades de entradaTexto, Imagem, Vídeo, Áudio
Modalidades de saídaVídeo
Janela de contexto-
Precisão do peso-
RegiãoSingapura
Característicasaudio_sync, character_consistency, multi_shot
Inferência nativaNão
NovoNão
Endpoints suportadosPOST /v1/videos/generations

Precificação

CargaEspecificaçãoTaxa
Todos os Modos 720Ppor segundo$0.10
Todos os Modos 1080Ppor segundo$0.150

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "wan-2-7", "prompt": "sunrise over the ocean", "duration": 6}'

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
promptStringsim-Descrição da cena.
modeenumNão"auto"T2V: text-to-video. i2v: animar a imagem anexada. Vídeoedit: Edite o vídeo anexado. R2V: reference-to-video. · Permitido: auto, t2v, i2v, videoedit, r2v
resolutionenumNão"1080p"Resolução de saída. Maior = maior fidelidade, mas mais lenta / mais cara. · Permitido: 720p, 1080p
durationNúmeroNão5Duração do clipe em segundos. · Alcance: 2 – 15 anos
aspect_ratioenumNão-Opcional. Se omitido, o modelo escolhe com base na entrada. · Permitido: 16:9, 9:16, 1:1, 4:3, 3:4
imageStringNão-URL da imagem de referência. Necessário para i2v / r2v / edição de vídeo.
videoStringNão-Consulte a URL do vídeo. Necessário para edição de vídeo / r2v.
negative_promptStringNão""O que evitar.
seedNúmeroNão-Semente de reprodutibilidade.
audio_settingenumNão"auto"Auto: Gerar áudio nativo. Origem: Mantenha o áudio do vídeo de referência (apenas videoedit/r2v). · Permitido: auto, origin
prompt_extendBooleanoNãoVerdadeExpanda e refine automaticamente o prompt para melhores resultados.

Notas

A geração pode levar 30+ minutos. Modos são detectados automaticamente em anexos - ou sobrescritos pelo parâmetro mode.

Modos

  • T2V: sem acessórios
  • I2V (Primeiro Quadro): 1 imagem
  • I2V (Primeiro + Último): exatamente 2 imagens
  • Continuação I2V: 1 vídeo (2-10s) + imagem opcional do último quadro
  • Edição de vídeo: 1 vídeo (2-10s, ≤100 MB, MP4/MOV) + até 3 imagens de referência
  • R2V: até 5 referências combinadas; Faça referência aos temas no seu prompt com Video1, Image1, etc.

Áudio opcional

  • T2V/I2V: 2-30 anos
  • R2V: 1-10s (usado como amostra de timbre de voz)
  • Máximo 15 MB,.mp3 ou.wav

Faturamento

  • Video Edit e R2V são faturados pela duração combinada de entrada + saída.

Pré-processamento de mídia enviado

  • Vídeos de referência e edição são normalizados para MP4 compatível com o provedor quando necessário.
  • A duração do vídeo de referência segue os limites de modo mostrados acima.

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/wan-2-7.