Tongyi Embedding Vision Plus | EmpirioLabs AI Docs

POST /v1/embeddings

텍스트, 이미지, 비디오 입력에 대해 독립적인 벡터를 생성하는 멀티모달 임베딩.

한눈에

필드	가치
모델 ID	`tongyi-embedding-vision-plus`
모델 출시일	2025-09-23
입력 양상	텍스트, 이미지, 비디오
출력 방식	임베딩
컨텍스트 윈도우	1024
무게 정밀도	-
지역	싱가포르
특징	다중양상 독립 벡터
원주민 추론	아니
신규	네
지원되는 엔드포인트	`POST /v1/embeddings`

가격

돌격	사양	요금
텍스트 입력	1M 토큰당	$0.09
이미지 / 비디오 입력	1M 토큰당	$0.09

예시 요청

$ curl https://api.empiriolabs.ai/v1/embeddings \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "tongyi-embedding-vision-plus", "input": [{"type":"text","text":"Embed me."},{"type":"image","url":"https://media.empiriolabs.ai/example.jpg"}]}'

매개변수

매개변수	유형	필수	기본 설정	설명
`input`	스트링	네	-	OpenAI 스타일의 부품 배열 `[{type:'image',url:...},{type:'text',text:...}]` 아니면 네이티브 부품 리스트 `{contents:[{image:'...'},{text:'...'}]}` 중 하나입니다. 최대 8장의 이미지(각 3MB), 동영상은 최대 10MB, 텍스트는 최대 1024개의 토큰까지 가능합니다.
`user`	스트링	아니	-	선택적 발신자 식별자.

주석

출력

입력당 고정된 1152-디뎁 벡터 (모달리티에 대한 융합 없음)

입력당 제한

텍스트: 최대 1,024개의 토큰
이미지: 요청당 최대 8장, 각 3MB (JPG, PNG, BMP)
비디오: 파일당 최대 10MB (MP4, MPEG, MOV, MPG, WEBM, AVI, FLV, MKV)

언어

중국어, 영어

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/tongyi-embedding-vision-plus.