Nova Pro 1.0

Nova Pro 1.0
Amazon · Text Generation
POST /v1/chat/completions

Multimodales Foundation-Modell balanciert Genauigkeit, Geschwindigkeit und Kosten für Text, Bilder und Video auf 300K-Kontext (bis zu ~30 Minuten Video).

Auf einen Blick

SpielfeldWert
Modell-IDnova-pro-1-0
Modell-Veröffentlichungsdatum2024-12-03
EingabemodalitätenText, Bild, Video
AusgabemodalitätenText
Kontextfenster300K
Gewichtspräzision-
Maximale Ausgabetoken5,000
MerkmaleVision
Native SchlussfolgerungNein
NeuNein
Unterstützte EndpunktePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Preisgestaltung

BerechnenSpezifikationZinssatz
Eingabepro 1M Prompt-Token$2.40
Ausgabepro 1 Million generierter Token$9.60
Latenzoptimierte Eingabepro 1M Prompt-Token$3.00
Latenzoptimierte Ausgabepro 1 Million generierter Token$12.00
Websuche (Linkup)pro Aufruf beim Aufruf$0.013

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "nova-pro-1-0", "messages": [{"role":"user","content":"Hello"}]}'

Parameter

ParameterTypErforderlichDefaultBeschreibung
temperatureAnzahlNein0.7Temperatur wird geprochen. 0 = deterministisch, 2 = maximale Zufälligkeit. · Reichweite: 0 – 2
top_pAnzahlNein0.9Kernprobenwahrscheinlichkeitsmasse. Niedriger = fokussierter. · Reichweite: 0 – 1
max_tokensAnzahlNein4096Maximale Token in der Antwort. · Reichweite: 1 – 65536
stopStringNein-Bis zu 4 Zeichenketten, bei denen das Modell aufhört, weitere Token zu generieren.
latency_optimizedBooleanNeinfalschBevorzuge schnelleres Routing zu einem geringen Qualitätspreis.
enable_latency_optimizedBooleanNeinfalschAktivieren Sie latenzoptimiertes Routing für schnellere Antworten, das im Katalog Latenzoptimierte Rate (3.00Eingabe/3.00 Eingabe / 12.00 Ausgabe pro 1M Token) statt der Standardrate abgerechnet wird.
web_search_linkupBooleanNeinfalschOptionale Websuche, betrieben von Linkup. Wenn aktiviert, werden aktuelle Webquellen mit Ihrer neuesten Benutzernachricht als Abfrage abgerufen und dem Modell als zusätzlicher Kontext bereitgestellt. Fügt pro Anfrage ein festes $0.013 zu den normalen Tokenkosten des Modells hinzu. Standardmäßig deaktiviert.
disable_formattingBooleanNeinfalschWenn aktiviert, fügt das Gateway den “Sources”-Footer nicht an Assistant-Antworten an, die die Linkup-Websuche verwendet haben. Nützlich, wenn die Modellausgabe an ein anderes System weitergeleitet wird, das keine Dekoration erwartet.

Anmerkungen

Optionale latenzoptimierte Inferenz für schnellere Reaktionen zu höheren Kosten.


Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/nova-pro-1-0.