Nova Lite 2

Amazon · Text Generation

POST /v1/chat/completions

Modèle de raisonnement multimodal rapide et économique pour texte, images, documents et vidéo sur un contexte 1M (longs documents et clips de ~90 min).

En un coup d’œil

Terrain	Valeur
Identifiant de modèle	`nova-lite-2`
Date de sortie du modèle	2025-12-02
Modalités d’entrée	Texte, Image, Vidéo, Document
Modalités de sortie	Texte
Fenêtre de contexte	1M
Précision du poids	-
Jetons de sortie max	32,000
Caractéristiques	Vision
Inférence autochtone	Non
Nouveau	Non
Points de terminaison pris en charge	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Tarification

Charge	Spec	Taux
Entrée	par 1M de jetons d’invite	$0.38
Production	par 1M de jetons générés	$3.16
Entrée mise en cache	par 1M de jetons	$0.2128
Recherche Web (Linkup)	par appel lors de l’invocation	$0.013

Exemple de demande

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "nova-lite-2", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

Paramètre	Type	Obligatoire	Par défaut	Description
`temperature`	Nombre	non	`0.7`	Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
`top_p`	Nombre	non	`0.9`	Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
`max_tokens`	Nombre	non	`4096`	Maximum de jetons dans la réponse. · Répartition: 1 – 65536
`stop`	Corde	non	-	Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
`enable_reasoning`	Booléen	non	Vrai	Activez le mode de raisonnement du modèle. Plus lent mais améliore les problèmes à plusieurs étapes.
`enable_thinking`	Booléen	non	Vrai	Activez un raisonnement étendu avant la réponse finale. Alias de enable_reasoning.
`reasoning_effort`	enum	non	`"medium"`	Niveau d’effort de raisonnement (faible \| Médium \| élevé). Plus élevé = plus de temps de réflexion. · Autorisé: `low`, `medium`, `high`
`reasoning`	Corde	non	-	Réponse API objet de raisonnement: {“effort »:“low\|Médium
`web_search_linkup`	Booléen	non	faux	Recherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
`disable_formatting`	Booléen	non	faux	Une fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

Notes

Les traces de raisonnement ne sont PAS exposées via AWS. La vidéo peut être téléchargée jusqu’à ~1 Go.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/nova-lite-2.