Qwen3 Rerank

Qwen3 Rerank
Alibaba Cloud · Reranker
POST /v1/reranks

セマンティックドキュメントのリランク。1クエリあたり最大500の候補を関連性でソートし、100+言語をサポートし、カスタムソート命令も受け入れます。

一目で

フィールド価値
モデルIDqwen3-rerank
モデル発売日2025-06-05
入力モダリティ本文
出力モダリティランキング
コンテキストウィンドウ4000
重量精度-
地域シンガポール
特徴セマンティックランキング、多言語、RAG、カスタム命令
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/reranks

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$0.10

例示リクエスト

$curl https://api.empiriolabs.ai/v1/reranks \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

パラメータ

パラメータ種類必須デフォルト概要
queryストリングはい-文書をランク付けするためのクエリテキスト。最大4,000トークン。
documents配列はい-候補文書をソートする(文字列)。最大500個のアイテム、各アイテム最大4,000トークンまで。
top_n番号いいえ10返却すべき上位文書の数。デフォルトはすべてに。·射程:1 – 500
instructストリングいいえ"Given a web search query, retrieve relevant passages that answer the query."カスタム英語指導。類似性ソートには「意味的に類似したテキストを取得」を使いましょう。
return_documentsブール値いいえ偽りもし正しい場合は、各結果の隣に元の文書テキストを返します。

注記

リクエストごとの制限

  • 1件あたり最大500件の候補者書類
  • 1query/documentあたり最大4,000トークン
  • リクエストあたり最大120,000トークン(式:query_tokens × n_docs + sum_of_doc_tokens)
  • 請求されるトークンはクエリ+ドキュメントの合計です。ランク変更に成功した場合にのみ課金されます

言語

  • 中国語、英語、スペイン語、フランス語、ポルトガル語、インドネシア語、日本語、韓国語、ドイツ語、ロシア語を含む100+の主要言語

ソートモード(instructパラメータ)

  • デフォルト - Q&Aの取得:Given a web search query, retrieve relevant passages that answer the query.
  • 意味的類似性:Retrieve semantically similar text.
  • またはカスタム英語の指示(モデルタスクプロンプト参照))

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank