Tongyi Embedding Vision Plus

Tongyi Embedding Vision Plus
Alibaba Cloud · Embeddings
POST /v1/embeddings

多模态嵌入产生文本、图像和视频输入的独立矢量。

一眼看

场地价值
型号IDtongyi-embedding-vision-plus
车型发布日期2025-09-23
输入模态文本、图像、视频
输出模态嵌入
上下文窗口1024
重量精度-
地区新加坡
特色多模态、独立向量
本土推断
是的
支持的端点POST /v1/embeddings

定价

冲锋规格速率
文本输入每100万个代币$0.09
图像/视频输入每100万个代币$0.09

示例请求

$curl https://api.empiriolabs.ai/v1/embeddings \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "tongyi-embedding-vision-plus", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

参数

参数类型必修默认描述
input是的-要么是 OpenAI 风格的零件数组[{type:'image',url:...},{type:'text',text:...}],要么是本地零件列表{contents:[{image:'...'},{text:'...'}]}。最多支持 8 张图片,每张 3 MB,视频最高 10 MB,文本最多 1024 个令牌。
user-可选来电标识。

注释

输出

  • 固定每个输入的1152-dim矢量(不跨模态融合)

每输入限制

  • 文本:最多1,024个代币
  • 图片:每个请求最多8张,每张3MB(JPG、PNG、BMP)
  • 视频:每个文件最多10MB(MP4、MPEG、MOV、MPG、WEBM、AVI、FLV、MKV)

语言

  • 中文,英语

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-plus