Qwen3 Rerank

Qwen3 Rerank
Alibaba Cloud · Reranker
POST /v1/reranks

Reclassificador semântico de documentos. Ordena até 500 candidatos por consulta por relevância, suporta 100+ idiomas e aceita uma instrução de ordenação personalizada.

De um olhar

CampoValor
ID do modeloqwen3-rerank
Data de lançamento do modelo2025-06-05
Modalidades de entradaTexto
Modalidades de saídaClassificação
Janela de contexto4000
Precisão do peso-
RegiãoSingapura
CaracterísticasClassificação semântica, multilíngue, RAG, instruções personalizadas
Inferência nativaNão
NovoSim
Endpoints suportadosPOST /v1/reranks

Precificação

CargaEspecificaçãoTaxa
Entradapor 1M de tokens de prompt$0.10

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/reranks \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
queryStringsim-Consulte texto para classificar documentos em relação a eles. No máximo 4.000 tokens.
documentsArranjosim-Documentos candidatos a ordenar (strings). No máximo 500 itens, cada um até 4.000 fichas.
top_nNúmeroNão10Número de documentos mais bem classificados a serem devoltidos. O padrão é para todos. · Alcance: 1 – 500
instructStringNão"Given a web search query, retrieve relevant passages that answer the query."Instrução personalizada em inglês. Use “Recuperar texto semanticamente semelhante.” para ordenação por similaridade.
return_documentsBooleanoNãofalsoQuando for verdade, retorne o texto original do documento junto com cada resultado.

Notas

Limites por pedido

  • Até 500 documentos de candidato por solicitação
  • No máximo 4.000 tokens por query/document
  • Máximo 120.000 tokens por solicitação (fórmula: query_tokens × n_docs + sum_of_doc_tokens)
  • Os tokens faturados são consulta+documentos combinados; apenas reclassificações bem-sucedidas são cobradas

Idiomas

  • 100+ idiomas principais, incluindo chinês, inglês, espanhol, francês, português, indonésio, japonês, coreano, alemão, russo

Modos de ordenação (parâmetro instruct)

  • Padrão - Recuperação de perguntas e respostas: Given a web search query, retrieve relevant passages that answer the query.
  • Semelhança semântica: Retrieve semantically similar text.
  • Ou qualquer instrução personalizada em inglês (veja prompts de tarefa modelo)

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank.