Nova Micro 1.0

Nova Micro 1.0
Amazon · Text Generation
POST /v1/chat/completions

Modèle de fondation uniquement textuel, ajusté pour une latence et un coût ultra-bas sur un contexte de 128K. Fort pour la synthèse, la traduction et le chat avec une réduction de 44 % sur le cache.

En un coup d’œil

TerrainValeur
Identifiant de modèlenova-micro-1-0
Date de sortie du modèle2024-12-03
Modalités d’entréeTexte
Modalités de sortieTexte
Fenêtre de contexte128K
Précision du poids-
Jetons de sortie max5,000
CaractéristiquesVite
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/chat/completions, POST /v1/responses, POST /v1/messages

Tarification

ChargeSpecTaux
Entréepar 1M de jetons d’invite$0.040
Productionpar 1M de jetons générés$0.16
Entrée mise en cachepar 1M de jetons$0.0224
Recherche Web (Linkup)par appel lors de l’invocation$0.013

Exemple de demande

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "nova-micro-1-0", "messages": [{"role":"user","content":"Hello"}]}'

Paramètres

ParamètreTypeObligatoirePar défautDescription
temperatureNombrenon0.7Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2
top_pNombrenon0.9Probabilité d’échantillonnage du noyau, masse. Plus bas = plus concentré. · Répartition: 0 – 1
max_tokensNombrenon4096Maximum de jetons dans la réponse. · Répartition: 1 – 65536
stopCordenon-Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons.
web_search_linkupBooléennonfauxRecherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut.
disable_formattingBooléennonfauxUne fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration.

Notes

44 % de réduction sur le chat en cache.


_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/nova-micro-1-0.