Wan 2.7 | EmpirioLabs AI Docs

Alibaba Cloud · Video Generation

POST /v1/videos/generations

Modelo de vídeo multimodal suportando T2V, I2V, edição de vídeo e reference-to-video, com saída de alta fidelidade a partir de entradas, texto, imagem ou vídeo.

De um olhar

Campo	Valor
ID do modelo	`wan-2-7`
Data de lançamento do modelo	2026-04-26
Modalidades de entrada	Texto, Imagem, Vídeo, Áudio
Modalidades de saída	Vídeo
Janela de contexto	-
Precisão do peso	-
Região	Singapura
Características	audio_sync, character_consistency, multi_shot
Inferência nativa	Não
Novo	Não
Endpoints suportados	`POST /v1/videos/generations`

Precificação

Carga	Especificação	Taxa
Todos os Modos 720P	por segundo	$0.10
Todos os Modos 1080P	por segundo	$0.150

Exemplo de pedido

$ curl https://api.empiriolabs.ai/v1/videos/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "wan-2-7", "prompt": "sunrise over the ocean", "duration": 6}'

Parâmetros

Parâmetro	Tipo	Obrigatório	Padrão	Descrição
`prompt`	String	sim	-	Descrição da cena.
`mode`	enum	Não	`"auto"`	T2V: text-to-video. i2v: animar a imagem anexada. Vídeoedit: Edite o vídeo anexado. R2V: reference-to-video. · Permitido: `auto`, `t2v`, `i2v`, `videoedit`, `r2v`
`resolution`	enum	Não	`"1080p"`	Resolução de saída. Maior = maior fidelidade, mas mais lenta / mais cara. · Permitido: `720p`, `1080p`
`duration`	Número	Não	`5`	Duração do clipe em segundos. · Alcance: 2 – 15 anos
`aspect_ratio`	enum	Não	-	Opcional. Se omitido, o modelo escolhe com base na entrada. · Permitido: `16:9`, `9:16`, `1:1`, `4:3`, `3:4`
`image`	String	Não	-	URL da imagem de referência. Necessário para i2v / r2v / edição de vídeo.
`video`	String	Não	-	Consulte a URL do vídeo. Necessário para edição de vídeo / r2v.
`negative_prompt`	String	Não	`""`	O que evitar.
`seed`	Número	Não	-	Semente de reprodutibilidade.
`audio_setting`	enum	Não	`"auto"`	Auto: Gerar áudio nativo. Origem: Mantenha o áudio do vídeo de referência (apenas videoedit/r2v). · Permitido: `auto`, `origin`
`prompt_extend`	Booleano	Não	Verdade	Expanda e refine automaticamente o prompt para melhores resultados.

Notas

A geração pode levar 30+ minutos. Modos são detectados automaticamente em anexos - ou sobrescritos pelo parâmetro mode.

Modos

T2V: sem acessórios
I2V (Primeiro Quadro): 1 imagem
I2V (Primeiro + Último): exatamente 2 imagens
Continuação I2V: 1 vídeo (2-10s) + imagem opcional do último quadro
Edição de vídeo: 1 vídeo (2-10s, ≤100 MB, MP4/MOV) + até 3 imagens de referência
R2V: até 5 referências combinadas; Faça referência aos temas no seu prompt com Video1, Image1, etc.

Áudio opcional

T2V/I2V: 2-30 anos
R2V: 1-10s (usado como amostra de timbre de voz)
Máximo 15 MB,.mp3 ou.wav

Faturamento

Video Edit e R2V são faturados pela duração combinada de entrada + saída.

Pré-processamento de mídia enviado

Vídeos de referência e edição são normalizados para MP4 compatível com o provedor quando necessário.
A duração do vídeo de referência segue os limites de modo mostrados acima.

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/wan-2-7.