Tongyi Embedding Vision Flash | EmpirioLabs AI Docs

POST /v1/embeddings

速度最適化されたマルチモーダル埋め込み - Vision-Plusと同じ形状で、3×安価なimage/videoトークン。

一目で

フィールド	価値
モデルID	`tongyi-embedding-vision-flash`
モデル発売日	2025-09-23
入力モダリティ	テキスト、画像、ビデオ
出力モダリティ	埋め込み
コンテキストウィンドウ	1024
重量精度	-
地域	シンガポール
特徴	マルチモーダル、独立ベクトル、低コスト
ネイティブ推論	いいえ
新作	はい
サポート端末	`POST /v1/embeddings`

価格設定

チャージ	スペック	レート
テキスト入力	1Mトークンあたり	$0.09
画像/映像入力	1Mトークンあたり	$0.03

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/embeddings \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "tongyi-embedding-vision-flash", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`input`	ストリング	はい	-	OpenAIスタイルのパーツ配列`[{type:'image',url:...},{type:'text',text:...}]`か、ネイティブのパーツリスト`{contents:[{image:'...'},{text:'...'}]}`のいずれかです。最大8枚の画像(1枚あたり3MB)、動画最大10MB、テキスト最大1024トークンまで。
`user`	ストリング	いいえ	-	発信者識別番号はオプションで。

注記

アウトプット

入力あたり固定768ディムベクトル

入力あたりの制限

テキスト:最大1,024トークン
画像:リクエストごとに最大8枚、1枚3MB(JPG、PNG、BMP)
映像:1ファイルあたり最大10MB(MP4、MPEG、MOV、MPG、WEBM、AVI、FLV、MKV)

言語

中国語、英語

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-flash。