Qwen3 Rerank

Alibaba Cloud · Reranker
POST /v1/reranksReclassificador semântico de documentos. Ordena até 500 candidatos por consulta por relevância, suporta 100+ idiomas e aceita uma instrução de ordenação personalizada.
De um olhar
Precificação
Exemplo de pedido
Parâmetros
Notas
Limites por pedido
- Até 500 documentos de candidato por solicitação
- No máximo 4.000 tokens por query/document
- Máximo 120.000 tokens por solicitação (fórmula: query_tokens × n_docs + sum_of_doc_tokens)
- Os tokens faturados são consulta+documentos combinados; apenas reclassificações bem-sucedidas são cobradas
Idiomas
- 100+ idiomas principais, incluindo chinês, inglês, espanhol, francês, português, indonésio, japonês, coreano, alemão, russo
Modos de ordenação (parâmetro instruct)
- Padrão - Recuperação de perguntas e respostas:
Given a web search query, retrieve relevant passages that answer the query. - Semelhança semântica:
Retrieve semantically similar text. - Ou qualquer instrução personalizada em inglês (veja prompts de tarefa modelo)
Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank.
