Tongyi Embedding Vision Flash

Tongyi Embedding Vision Flash
Alibaba Cloud · Embeddings
POST /v1/embeddings

Embebido multimodal optimizado para velocidad - misma forma que Vision-Plus, tokens de image/video 3× más baratos.

A simple vista

CampoValor
ID de modelotongyi-embedding-vision-flash
Fecha de lanzamiento del modelo2025-09-23
Modalidades de entradaTexto, Imagen, Vídeo
Modalidades de salidaIncrustación
Ventana de contexto1024
Precisión del peso-
RegiónSingapur
CaracterísticasMultimodales, vectores independientes, bajo coste
Inferencia nativaNo
Nuevo
Puntos finales soportadosPOST /v1/embeddings

Precios

CargaEspecificacionesTarifa
Entrada de textopor cada 1M de fichas$0.09
Entrada de imagen / vídeopor cada 1M de fichas$0.03

Solicitud de ejemplo

$curl https://api.empiriolabs.ai/v1/embeddings \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "tongyi-embedding-vision-flash", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

Parámetros

ParámetroTipoObligatorioDefaultDescripción
inputCuerda-O bien un [{type:'image',url:...},{type:'text',text:...}] de matriz de piezas al estilo OpenAI o una lista de piezas nativa {contents:[{image:'...'},{text:'...'}]}. Hasta 8 imágenes de 3 MB cada una, vídeo de hasta 10 MB, texto de hasta 1024 tokens.
userCuerdano-Identificador opcional de llamante.

Notas

Salida

  • Vector fijo de 768 dim por entrada

Límites por entrada

  • Texto: hasta 1.024 fichas
  • Imagen: hasta 8 por solicitud, 3 MB cada uno (JPG, PNG, BMP)
  • Vídeo: hasta 10 MB por archivo (MP4, MPEG, MOV, MPG, WEBM, AVI, FLV, MKV)

Idiomas

  • Chino, inglés

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-flash.