Nova Lite 2

Nova Lite 2
Amazon · Text Generation
POST /v1/chat/completions

Modèle de raisonnement multimodal rapide et économique pour texte, images, documents et vidéo sur un contexte 1M (longs documents et clips de ~90 min).

En un coup d’œil

TerrainValeur
Identifiant de modèlenova-lite-2
Date de sortie du modèle2025-12-02
Modalités d’entréeTexte, Image, Vidéo, Document
Modalités de sortieTexte
Fenêtre de contexte1M
Précision du poids-
Jetons de sortie max32,000
CaractéristiquesVision
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.38
Productionpar 1M de jetons générés$3.16
Entrée mise en cachepar 1M de jetons$0.2128
Recherche Web (Linkup)par appel lors de l’invocation$0.013

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "nova-lite-2", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Maximum de jetons dans la réponse. · Répartition: 1 – 65536
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
enable_reasoningBooléennonVraiActivez le mode de raisonnement du modèle. Plus lent mais améliore les problèmes à plusieurs étapes.
enable_thinkingBooléennonVraiActivez un raisonnement étendu avant la réponse finale. Alias de enable_reasoning.
reasoning_effortenumnon"medium"Niveau d’effort de raisonnement (faible | Médium | élevé). Plus élevé = plus de temps de réflexion. · Autorisé: low, medium, high
reasoningCordenon-Réponse API objet de raisonnement: {“effort »:“low|Médium
web_search_linkupBooléennonfauxRecherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
disable_formattingBooléennonfauxUne fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

Notes

Les traces de raisonnement ne sont PAS exposées via AWS. La vidéo peut être téléchargée jusqu’à ~1 Go.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/nova-lite-2.