Tongyi Embedding Vision Flash

Tongyi Embedding Vision Flash
Alibaba Cloud · Embeddings
POST /v1/embeddings

Intégration multimodale optimisée en vitesse - même forme que Vision-Plus, 3 × moins cher image/video tokens.

En un coup d’œil

TerrainValeur
Identifiant de modèletongyi-embedding-vision-flash
Date de sortie du modèle2025-09-23
Modalités d’entréeTexte, Image, Vidéo
Modalités de sortieIntégration
Fenêtre de contexte1024
Précision du poids-
RégionSingapour
CaractéristiquesMultimodal, vecteurs indépendants, faible coût
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/embeddings

Tarification

ChargeSpecTaux
Saisie de textepar 1M de jetons$0.09
Entrée image / vidéopar 1M de jetons$0.03

Exemple de demande

$curl https://api.empiriolabs.ai/v1/embeddings \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "tongyi-embedding-vision-flash", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
inputCordeOui-Soit un [{type:'image',url:...},{type:'text',text:...}] de pièces à la manière OpenAI, soit une liste native de pièces {contents:[{image:'...'},{text:'...'}]}. Jusqu’à 8 images à 3 Mo chacune, la vidéo jusqu’à 10 Mo, le texte jusqu’à 1024 jetons.
userCordenon-Identifiant d’appelant optionnel.

Notes

Sortie

  • Vecteur fixe 768-dim par entrée

Limites par entrée

  • Texte: jusqu’à 1 024 jetons
  • Image: jusqu’à 8 par requête, 3 Mo chacun (JPG, PNG, BMP)
  • Vidéo: jusqu’à 10 Mo par fichier (MP4, MPEG, MOV, MPG, WEBM, AVI, FLV, MKV)

Langues

  • Chinois, anglais

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-flash.