Qwen3 Rerank

Qwen3 Rerank
Alibaba Cloud · Reranker
POST /v1/reranks

Reclasificador semántico de documentos. Ordena hasta 500 candidatos por consulta por relevancia, soporta 100+ lenguajes y acepta instrucciones de ordenación personalizadas.

A simple vista

CampoValor
ID de modeloqwen3-rerank
Fecha de lanzamiento del modelo2025-06-05
Modalidades de entradaTexto
Modalidades de salidaClasificación
Ventana de contexto4000
Precisión del peso-
RegiónSingapur
CaracterísticasClasificación semántica, multilingüe, RAG, instrucciones personalizadas
Inferencia nativaNo
Nuevo
Puntos finales soportadosPOST /v1/reranks

Precios

CargaEspecificacionesTarifa
Entradapor 1M de fichas de prompt$0.10

Solicitud de ejemplo

$curl https://api.empiriolabs.ai/v1/reranks \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

Parámetros

ParámetroTipoObligatorioDefaultDescripción
queryCuerda-Consulta el texto para clasificar documentos en contra. Máximo 4.000 fichas.
documentsMatriz-Documentos candidatos para ordenar (cadenas). Máximo 500 objetos, cada uno hasta 4.000 fichas.
top_nNúmerono10Número de documentos mejor valorados que devolver. Por defecto es todo. · Rango: 1 – 500
instructCuerdano"Given a web search query, retrieve relevant passages that answer the query."Instrucción personalizada en inglés. Usa “Recuperar texto semánticamente similar.” para ordenar similitudes.
return_documentsBooleanonofalsoCuando sea cierto, devuelva el texto original del documento junto a cada resultado.

Notas

Límites por solicitud

  • Hasta 500 documentos de candidato por solicitud
  • Máximo 4.000 fichas por query/document
  • Máximo 120.000 tokens por solicitud (fórmula: query_tokens × n_docs + sum_of_doc_tokens)
  • Los tokens facturados se combinan consulta+documentos; solo se cobran los reclasificaciones exitosas

Idiomas

  • 100+ idiomas principales, incluyendo chino, inglés, español, francés, portugués, indonesio, japonés, coreano, alemán, ruso

Modos de ordenación (parámetro instruct)

  • Respuesta por defecto - Recuperación de preguntas y respuestas: Given a web search query, retrieve relevant passages that answer the query.
  • Similitud semántica: Retrieve semantically similar text.
  • O cualquier instrucción personalizada en inglés (véase prompts de tarea modelo)

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank.