Qwen3 Rerank

Qwen3 Rerank
Alibaba Cloud · Reranker
POST /v1/reranks

Semantischer Dokument-Reranker. Sortiert bis zu 500 Kandidaten pro Abfrage nach Relevanz, unterstützt 100+ Sprachen und akzeptiert eine benutzerdefinierte Sortieranweisung.

Auf einen Blick

SpielfeldWert
Modell-IDqwen3-rerank
Modell-Veröffentlichungsdatum2025-06-05
EingabemodalitätenText
AusgabemodalitätenRangliste
Kontextfenster4000
Gewichtspräzision-
RegionSingapur
MerkmaleSemantisches Ranking, mehrsprachig, RAG, benutzerdefinierte Anweisungen
Native SchlussfolgerungNein
NeuJa
Unterstützte EndpunktePOST /v1/reranks

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$0.10

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/reranks \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-rerank", "query": "What is a rerank model?", "documents": ["Rerank models sort candidate documents by relevance.", "Quantum computing is a cutting-edge field of computer science.", "Pre-trained language models advanced rerank models."], "top_n": 2, "return_documents": true}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
queryStringJa-Abfrage von Texten, um Dokumente zu bewerten. Maximal 4.000 Token.
documentsAnordnungJa-Kandidatendokumente zum Sortieren (Strings). Maximal 500 Gegenstände, jeweils bis zu 4.000 Marken.
top_nAnzahlNein10Anzahl der hochrangigen Dokumente, die zurückgegeben werden sollen. Standardmäßig alle Optionen. · Reichweite: 1 – 500
instructStringNein"Given a web search query, retrieve relevant passages that answer the query."Individueller Englischunterricht. Verwenden Sie “Semantisch ähnlichen Text abrufen” für die Ähnlichkeitssortierung.
return_documentsBooleanNeinfalschWenn zutreffend, gib den ursprünglichen Dokumenttext zusammen mit jedem Ergebnis zurück.

Anmerkungen

Limits pro Anfrage

  • Bis zu 500 Kandidatendokumente pro Anfrage
  • Maximal 4.000 Token pro query/document
  • Maximal 120.000 Token pro Anfrage (Formel: query_tokens × n_docs + sum_of_doc_tokens)
  • Die abgeregelten Token sind Anfrage+Dokumente kombiniert; Es werden nur erfolgreiche Umstellungen angerechnet

Sprachen

  • 100+ Hauptsprachen, darunter Chinesisch, Englisch, Spanisch, Französisch, Portugiesisch, Indonesisch, Japanisch, Koreanisch, Deutsch, Russisch

Sortiermodi (instruct Parameter)

  • Standard - Q&A-Abruf: Given a web search query, retrieve relevant passages that answer the query.
  • Semantische Ähnlichkeit: Retrieve semantically similar text.
  • Oder jede benutzerdefinierte Englischanleitung (siehe Model Task Prompts)

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/qwen3-rerank.