Kling 3.0 Turbo | EmpirioLabs AI Docs

Kling AI · Video Generation

POST /v1/videos/generations

Texto a vídeo y image-to-video con audio nativo sincronizado, en 720p o 1080p durante 3 a 15 segundos, con relación de aspecto y control de prompts.

A simple vista

Campo	Valor
ID de modelo	`kling-3-0-turbo`
Fecha de lanzamiento del modelo	2026-06-17
Modalidades de entrada	Texto, Imagen
Modalidades de salida	Vídeo
Ventana de contexto	-
Precisión del peso	-
Características	text_to_video, image_to_video, audio, video_generation
Inferencia nativa	No
Nuevo	Sí
Puntos finales soportados	`POST /v1/videos/generations`

Precios

Carga	Especificaciones	Tarifa
720p	por segundo	$0.18
1080p	por segundo	$0.225

Solicitud de ejemplo

$ curl https://api.empiriolabs.ai/v1/videos/generations \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "kling-3-0-turbo", "prompt": "sunrise over the ocean", "duration": 6}'

Parámetros

Parámetro	Tipo	Obligatorio	Default	Descripción
`prompt`	Cuerda	Sí	-	Describe el vídeo (text-to-video) o el movimiento a aplicar a la imagen original (image-to-video).
`image`	Cuerda	no	-	Imagen fuente opcional (URL o base64). Cuando se proporciona, la solicitud es image-to-video; Cuando se omite, text-to-video.
`resolution`	enum	no	`"720p"`	Resolución de salida. 720p se renderiza más rápido; 1080p es de mayor fidelidad. · Permitidos: `720p`, `1080p`
`aspect_ratio`	enum	no	`"16:9"`	Relación de aspecto de la salida. Usado para text-to-video; image-to-video sigue la imagen fuente. · Permitidos: `16:9`, `9:16`, `1:1`
`duration`	Número	no	`5`	Duración del vídeo en segundos. · Rango: 3 – 15
`watermark`	Booleano	no	falso	Añade una marca de agua al vídeo generado. Desactivado por defecto.

Notas

Texto a vídeo y image-to-video con audio nativo sincronizado, hasta 1080p. Flujo de trabajo detectado automáticamente: solo un prompt es text-to-video, añadir una imagen fuente es image-to-video.

Prompt

No hay un prompt negativo separado. Para evitar elementos no deseados, descríbelos en tu prompt, por ejemplo: “un bosque tranquilo al amanecer, evita movimientos borrosos, nada de texto en pantalla”.

Toma múltiple

Genera hasta 6 tomas secuenciales formateando el prompt como shot 1, <seconds>, <description>; shot 2, <seconds>, <description>; (la duración de las tomas debe sumar la duración total).

Límites de entrada

Solicita hasta 3.072 caracteres. Resolución 720p o 1080p. Duración de 3 a 15 segundos. Relación de aspecto 16:9, 9:16 o 1:1 para text-to-video (image-to-video sigue a la imagen original).
Entradas de imagen: JPEG o PNG, al menos 300px por lado, aspecto dentro de 1:2.5 a 2.5:1, hasta 50 MB.

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/kling-3-0-turbo.