Tongyi Embedding Vision Flash

Tongyi Embedding Vision Flash
Alibaba Cloud · Embeddings
POST /v1/embeddings

速度最適化されたマルチモーダル埋め込み - Vision-Plusと同じ形状で、3×安価なimage/videoトークン。

一目で

フィールド価値
モデルIDtongyi-embedding-vision-flash
モデル発売日2025-09-23
入力モダリティテキスト、画像、ビデオ
出力モダリティ埋め込み
コンテキストウィンドウ1024
重量精度-
地域シンガポール
特徴マルチモーダル、独立ベクトル、低コスト
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/embeddings

価格設定

チャージスペックレート
テキスト入力1Mトークンあたり$0.09
画像/映像入力1Mトークンあたり$0.03

例示リクエスト

$curl https://api.empiriolabs.ai/v1/embeddings \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "tongyi-embedding-vision-flash", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

パラメータ

パラメータ種類必須デフォルト概要
inputストリングはい-OpenAIスタイルのパーツ配列[{type:'image',url:...},{type:'text',text:...}]か、ネイティブのパーツリスト{contents:[{image:'...'},{text:'...'}]}のいずれかです。最大8枚の画像(1枚あたり3MB)、動画最大10MB、テキスト最大1024トークンまで。
userストリングいいえ-発信者識別番号はオプションで。

注記

アウトプット

  • 入力あたり固定768ディムベクトル

入力あたりの制限

  • テキスト:最大1,024トークン
  • 画像:リクエストごとに最大8枚、1枚3MB(JPG、PNG、BMP)
  • 映像:1ファイルあたり最大10MB(MP4、MPEG、MOV、MPG、WEBM、AVI、FLV、MKV)

言語

  • 中国語、英語

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-flash