Qwen3 Rerank

Qwen3 Rerank
Alibaba Cloud · Reranker
POST /v1/reranks

의미 문서 리랭커. 관련성별로 쿼리당 최대 500개의 후보를 정렬하며, 100+ 언어를 지원하고 맞춤형 정렬 명령어를 허용합니다.

한눈에

필드가치
모델 IDqwen3-rerank
모델 출시일2025-06-05
입력 양상본문
출력 방식순위
컨텍스트 윈도우4000
무게 정밀도-
지역싱가포르
특징의미 순위, 다국어, RAG, 맞춤 명령어
원주민 추론아니
신규
지원되는 엔드포인트POST /v1/reranks

가격

돌격사양요금
입력1M 프롬프트 토큰당$0.10

예시 요청

$curl https://api.empiriolabs.ai/v1/reranks \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

매개변수

매개변수유형필수기본 설정설명
query스트링-문서 순위를 매기기 위한 쿼리 텍스트. 최대 4,000 토큰.
documents배열-정렬할 후보 문서(문자열). 최대 500개의 아이템, 각 아이템은 최대 4,000 토큰까지 허용됩니다.
top_n번호아니10반환해야 할 상위 문서 수. 기본값은 모두입니다. · 사거리: 1 – 500
instruct스트링아니"Given a web search query, retrieve relevant passages that answer the query."맞춤형 영어 강의. 유사도 정렬을 위해 “의미적으로 유사한 텍스트를 검색하세요.”를 사용하세요.
return_documents불리언아니거짓참일 경우, 각 결과 옆에 원본 문서 텍스트를 반환합니다.

주석

요청당 제한

  • 요청당 최대 500개의 후보자 문서 제출
  • query/document당 최대 4,000 토큰
  • 요청당 최대 120,000 토큰 (공식: query_tokens × n_docs + sum_of_doc_tokens)
  • 청구되는 토큰은 쿼리+문서의 결합입니다; 재계급에 성공한 경우에만 요금이 부과됩니다

언어

  • 중국어, 영어, 스페인어, 프랑스어, 포르투갈어, 인도네시아어, 일본어, 한국어, 독일어, 러시아어 등 100+ 주요 언어

정렬 모드 (instruct 매개변수)

  • 기본 - Q&A 검색: Given a web search query, retrieve relevant passages that answer the query.
  • 의미적 유사성: Retrieve semantically similar text.
  • 또는 어떤 맞춤형 영어 지침(모델 작업 프롬프트) 참조)

Machine-읽기 가능한 스키마: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank.