Qwen3 Rerank

Qwen3 Rerank
Alibaba Cloud · Reranker
POST /v1/reranks

Reclasseur sémantique de documents. Trie jusqu’à 500 candidats par requête selon leur pertinence, prend en charge 100+ langages et accepte une instruction de tri personnalisée.

En un coup d’œil

TerrainValeur
Identifiant de modèleqwen3-rerank
Date de sortie du modèle2025-06-05
Modalités d’entréeTexte
Modalités de sortieClassement
Fenêtre de contexte4000
Précision du poids-
RégionSingapour
CaractéristiquesClassement sémantique, multilingue, rag, instructions personnalisées
Inférence autochtoneNon
NouveauOui
Points de terminaison pris en chargePOST /v1/reranks

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.10

Exemple de demande

$curl https://api.empiriolabs.ai/v1/reranks \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
queryCordeOui-Requête du texte pour classer les documents. Maximum 4 000 jetons.
documentsTableauOui-Documents candidats à trier (chaînes de caractères). Maximum 500 objets, chacun jusqu’à 4 000 jetons.
top_nNombrenon10Nombre de documents les mieux classés à retourner. Par défaut, tout est appliqué. · Plage: 1 – 500
instructCordenon"Given a web search query, retrieve relevant passages that answer the query."Enseignement personnalisé de l’anglais. Utilisez « Retrieve semantiqually similar text. » pour le tri par similarité.
return_documentsBooléennonfauxLorsque c’est vrai, retournez le texte original du document à côté de chaque résultat.

Notes

Limites par demande

  • Jusqu’à 500 documents de candidature par demande
  • Maximum 4 000 jetons par query/document
  • Max 120 000 jetons par requête (formule: query_tokens × n_docs + sum_of_doc_tokens)
  • Les jetons facturés sont la combinaison requête+documents; Seuls les reclassements réussis sont facturés

Langues

  • 100+ langues majeures incluant le chinois, l’anglais, l’espagnol, le français, le portugais, l’indonésien, le japonais, le coréen, l’allemand, le russe

Modes de tri (paramètre instruct)

  • Recherche par défaut - Q&R: Given a web search query, retrieve relevant passages that answer the query.
  • Similarité sémantique: Retrieve semantically similar text.
  • Ou toute instruction anglaise personnalisée (voir modèles d’invite de tâche)

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/qwen3-rerank.