Nova Pro 1.0 | EmpirioLabs AI Docs

Amazon · Text Generation

POST /v1/chat/completions

Multimodales Foundation-Modell balanciert Genauigkeit, Geschwindigkeit und Kosten für Text, Bilder und Video auf 300K-Kontext (bis zu ~30 Minuten Video).

Auf einen Blick

Spielfeld	Wert
Modell-ID	`nova-pro-1-0`
Modell-Veröffentlichungsdatum	2024-12-03
Eingabemodalitäten	Text, Bild, Video
Ausgabemodalitäten	Text
Kontextfenster	300K
Gewichtspräzision	-
Maximale Ausgabetoken	5,000
Merkmale	Vision
Native Schlussfolgerung	Nein
Neu	Nein
Unterstützte Endpunkte	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Preisgestaltung

Berechnen	Spezifikation	Zinssatz
Eingabe	pro 1M Prompt-Token	$2.40
Ausgabe	pro 1 Million generierter Token	$9.60
Latenzoptimierte Eingabe	pro 1M Prompt-Token	$3.00
Latenzoptimierte Ausgabe	pro 1 Million generierter Token	$12.00
Websuche (Linkup)	pro Aufruf beim Aufruf	$0.013

Beispielanfrage

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "nova-pro-1-0", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

Parameter	Typ	Erforderlich	Default	Beschreibung
`temperature`	Anzahl	Nein	`0.7`	Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
`top_p`	Anzahl	Nein	`0.9`	Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
`max_tokens`	Anzahl	Nein	`4096`	Maximale Token in der Antwort. · Reichweite: 1 – 65536
`stop`	String	Nein	-	Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
`latency_optimized`	Boolean	Nein	falsch	Bevorzuge schnelleres Routing zu einem geringen Qualitätspreis.
`enable_latency_optimized`	Boolean	Nein	falsch	Aktivieren Sie latenzoptimiertes Routing für schnellere Antworten, das im Katalog Latenzoptimierte Rate ( $3.00 Eingabe /$ 12.00 Ausgabe pro 1M Token) statt der Standardrate abgerechnet wird.
`web_search_linkup`	Boolean	Nein	falsch	Optionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
`disable_formatting`	Boolean	Nein	falsch	Wenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Anmerkungen

Optionale latenzoptimierte Inferenz für schnellere Reaktionen zu höheren Kosten.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/nova-pro-1-0.