Tongyi Embedding Vision Plus | EmpirioLabs AI Docs

POST /v1/embeddings

多模态嵌入产生文本、图像和视频输入的独立矢量。

一眼看

场地	价值
型号ID	`tongyi-embedding-vision-plus`
车型发布日期	2025-09-23
输入模态	文本、图像、视频
输出模态	嵌入
上下文窗口	1024
重量精度	-
地区	新加坡
特色	多模态、独立向量
本土推断	不
新	是的
支持的端点	`POST /v1/embeddings`

定价

冲锋	规格	速率
文本输入	每100万个代币	$0.09
图像/视频输入	每100万个代币	$0.09

示例请求

$ curl https://api.empiriolabs.ai/v1/embeddings \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "tongyi-embedding-vision-plus", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

参数

参数	类型	必修	默认	描述
`input`	弦	是的	-	要么是 OpenAI 风格的零件数组`[{type:'image',url:...},{type:'text',text:...}]`，要么是本地零件列表`{contents:[{image:'...'},{text:'...'}]}`。最多支持 8 张图片，每张 3 MB，视频最高 10 MB，文本最多 1024 个令牌。
`user`	弦	不	-	可选来电标识。

注释

输出

固定每个输入的1152-dim矢量（不跨模态融合）

每输入限制

文本：最多1,024个代币
图片：每个请求最多8张，每张3MB（JPG、PNG、BMP）
视频：每个文件最多10MB（MP4、MPEG、MOV、MPG、WEBM、AVI、FLV、MKV）

语言

中文，英语

Machine可读模式： GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-plus。