Tongyi Embedding Vision Plus

Alibaba Cloud · Embeddings
POST /v1/embeddings텍스트, 이미지, 비디오 입력에 대해 독립적인 벡터를 생성하는 멀티모달 임베딩.
한눈에
가격
예시 요청
매개변수
주석
출력
- 입력당 고정된 1152-디뎁 벡터 (모달리티에 대한 융합 없음)
입력당 제한
- 텍스트: 최대 1,024개의 토큰
- 이미지: 요청당 최대 8장, 각 3MB (JPG, PNG, BMP)
- 비디오: 파일당 최대 10MB (MP4, MPEG, MOV, MPG, WEBM, AVI, FLV, MKV)
언어
- 중국어, 영어
Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-plus.
