Tongyi Embedding Vision Plus

Tongyi Embedding Vision Plus
Alibaba Cloud · Embeddings
POST /v1/embeddings

텍스트, 이미지, 비디오 입력에 대해 독립적인 벡터를 생성하는 멀티모달 임베딩.

한눈에

필드가치
모델 IDtongyi-embedding-vision-plus
모델 출시일2025-09-23
입력 양상텍스트, 이미지, 비디오
출력 방식임베딩
컨텍스트 윈도우1024
무게 정밀도-
지역싱가포르
특징다중양상 독립 벡터
원주민 추론아니
신규
지원되는 엔드포인트POST /v1/embeddings

가격

돌격사양요금
텍스트 입력1M 토큰당$0.09
이미지 / 비디오 입력1M 토큰당$0.09

예시 요청

$curl https://api.empiriolabs.ai/v1/embeddings \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "tongyi-embedding-vision-plus", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

매개변수

매개변수유형필수기본 설정설명
input스트링-OpenAI 스타일의 부품 배열 [{type:'image',url:...},{type:'text',text:...}] 아니면 네이티브 부품 리스트 {contents:[{image:'...'},{text:'...'}]} 중 하나입니다. 최대 8장의 이미지(각 3MB), 동영상은 최대 10MB, 텍스트는 최대 1024개의 토큰까지 가능합니다.
user스트링아니-선택적 발신자 식별자.

주석

출력

  • 입력당 고정된 1152-디뎁 벡터 (모달리티에 대한 융합 없음)

입력당 제한

  • 텍스트: 최대 1,024개의 토큰
  • 이미지: 요청당 최대 8장, 각 3MB (JPG, PNG, BMP)
  • 비디오: 파일당 최대 10MB (MP4, MPEG, MOV, MPG, WEBM, AVI, FLV, MKV)

언어

  • 중국어, 영어

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-plus.