Kling 3.0 Turbo

Kling 3.0 Turbo
Kling AI · Video Generation
POST /v1/videos/generations

Texto a vídeo y image-to-video con audio nativo sincronizado, en 720p o 1080p durante 3 a 15 segundos, con relación de aspecto y control de prompts.

A simple vista

CampoValor
ID de modelokling-3-0-turbo
Fecha de lanzamiento del modelo2026-06-17
Modalidades de entradaTexto, Imagen
Modalidades de salidaVídeo
Ventana de contexto-
Precisión del peso-
Característicastext_to_video, image_to_video, audio, video_generation
Inferencia nativaNo
Nuevo
Puntos finales soportadosPOST /v1/videos/generations

Precios

CargaEspecificacionesTarifa
720ppor segundo$0.18
1080ppor segundo$0.225

Solicitud de ejemplo

$curl https://api.empiriolabs.ai/v1/videos/generations \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "kling-3-0-turbo", "prompt": "sunrise over the ocean", "duration": 6}'

Parámetros

ParámetroTipoObligatorioDefaultDescripción
promptCuerda-Describe el vídeo (text-to-video) o el movimiento a aplicar a la imagen original (image-to-video).
imageCuerdano-Imagen fuente opcional (URL o base64). Cuando se proporciona, la solicitud es image-to-video; Cuando se omite, text-to-video.
resolutionenumno"720p"Resolución de salida. 720p se renderiza más rápido; 1080p es de mayor fidelidad. · Permitidos: 720p, 1080p
aspect_ratioenumno"16:9"Relación de aspecto de la salida. Usado para text-to-video; image-to-video sigue la imagen fuente. · Permitidos: 16:9, 9:16, 1:1
durationNúmerono5Duración del vídeo en segundos. · Rango: 3 – 15
watermarkBooleanonofalsoAñade una marca de agua al vídeo generado. Desactivado por defecto.

Notas

Texto a vídeo y image-to-video con audio nativo sincronizado, hasta 1080p. Flujo de trabajo detectado automáticamente: solo un prompt es text-to-video, añadir una imagen fuente es image-to-video.

Prompt

  • No hay un prompt negativo separado. Para evitar elementos no deseados, descríbelos en tu prompt, por ejemplo: “un bosque tranquilo al amanecer, evita movimientos borrosos, nada de texto en pantalla”.

Toma múltiple

  • Genera hasta 6 tomas secuenciales formateando el prompt como shot 1, <seconds>, <description>; shot 2, <seconds>, <description>; (la duración de las tomas debe sumar la duración total).

Límites de entrada

  • Solicita hasta 3.072 caracteres. Resolución 720p o 1080p. Duración de 3 a 15 segundos. Relación de aspecto 16:9, 9:16 o 1:1 para text-to-video (image-to-video sigue a la imagen original).
  • Entradas de imagen: JPEG o PNG, al menos 300px por lado, aspecto dentro de 1:2.5 a 2.5:1, hasta 50 MB.

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/kling-3-0-turbo.