Qwen3 Rerank

Qwen3 Rerank
Alibaba Cloud · Reranker
POST /v1/reranks

语义文档重新排序器。每个查询可按相关性排序最多500个候选人,支持100+语言,并接受自定义排序指令。

一眼看

场地价值
型号IDqwen3-rerank
车型发布日期2025-06-05
输入模态正文
输出模态排名
上下文窗口4000
重量精度-
地区新加坡
特色语义排序、多语言、RAG、自定义指令
本土推断
是的
支持的端点POST /v1/reranks

定价

冲锋规格速率
输入每100万个提示词标记$0.10

示例请求

$curl https://api.empiriolabs.ai/v1/reranks \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

参数

参数类型必修默认描述
query是的-查询文本以对文档进行排序。最多4000个代币。
documents数组是的-候选文档需要排序(字符串)。最多500件物品,每个最多4000个代币。
top_n人数10需归还的顶级文件数量。默认所有。·范围:1 – 500
instruct"Given a web search query, retrieve relevant passages that answer the query."定制英语教学。使用“检索语义相似文本”进行相似排序。
return_documents布尔值错误当为真时,返回原始文档文本并列每个结果。

注释

每个请求的限制

  • 每个请求最多可提交500份候选人文件
  • 每query/document最多4000个代币
  • 每个请求最多120,000个代币(公式:query_tokens × n_docs + sum_of_doc_tokens)
  • 计费的代币为查询+文档的组合;只有成功重新排名才会被收费

语言

  • 100+主要语言,包括中文、英语、西班牙语、法语、葡萄牙语、印度尼西亚语、日语、韩语、德语、俄语

排序模式(instruct参数)


Machine可读模式: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank