Qwen3 Rerank | EmpirioLabs AI Docs

POST /v1/reranks

Reclasificador semántico de documentos. Ordena hasta 500 candidatos por consulta por relevancia, soporta 100+ lenguajes y acepta instrucciones de ordenación personalizadas.

A simple vista

Campo	Valor
ID de modelo	`qwen3-rerank`
Fecha de lanzamiento del modelo	2025-06-05
Modalidades de entrada	Texto
Modalidades de salida	Clasificación
Ventana de contexto	4000
Precisión del peso	-
Región	Singapur
Características	Clasificación semántica, multilingüe, RAG, instrucciones personalizadas
Inferencia nativa	No
Nuevo	Sí
Puntos finales soportados	`POST /v1/reranks`

Precios

Carga	Especificaciones	Tarifa
Entrada	por 1M de fichas de prompt	$0.10

Solicitud de ejemplo

$ curl https://api.empiriolabs.ai/v1/reranks \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

Parámetros

Parámetro	Tipo	Obligatorio	Default	Descripción
`query`	Cuerda	Sí	-	Consulta el texto para clasificar documentos en contra. Máximo 4.000 fichas.
`documents`	Matriz	Sí	-	Documentos candidatos para ordenar (cadenas). Máximo 500 objetos, cada uno hasta 4.000 fichas.
`top_n`	Número	no	`10`	Número de documentos mejor valorados que devolver. Por defecto es todo. · Rango: 1 – 500
`instruct`	Cuerda	no	`"Given a web search query, retrieve relevant passages that answer the query."`	Instrucción personalizada en inglés. Usa “Recuperar texto semánticamente similar.” para ordenar similitudes.
`return_documents`	Booleano	no	falso	Cuando sea cierto, devuelva el texto original del documento junto a cada resultado.

Notas

Límites por solicitud

Hasta 500 documentos de candidato por solicitud
Máximo 4.000 fichas por query/document
Máximo 120.000 tokens por solicitud (fórmula: query_tokens × n_docs + sum_of_doc_tokens)
Los tokens facturados se combinan consulta+documentos; solo se cobran los reclasificaciones exitosas

Idiomas

100+ idiomas principales, incluyendo chino, inglés, español, francés, portugués, indonesio, japonés, coreano, alemán, ruso

Modos de ordenación (parámetro instruct)

Respuesta por defecto - Recuperación de preguntas y respuestas: Given a web search query, retrieve relevant passages that answer the query.
Similitud semántica: Retrieve semantically similar text.
O cualquier instrucción personalizada en inglés (véase prompts de tarea modelo)

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank.