Nova Pro 1.0

Nova Pro 1.0
Amazon · Text Generation
POST /v1/chat/completions

30万のコンテキスト(最大~30分の動画)におけるテキスト、画像、動画の精度、速度、コストのマルチモーダル基礎モデルのバランス。

一目で

フィールド価値
モデルIDnova-pro-1-0
モデル発売日2024-12-03
入力モダリティテキスト、画像、ビデオ
出力モダリティ本文
コンテキストウィンドウ30万
重量精度-
最大出力トークン5,000
特徴ビジョン
ネイティブ推論いいえ
新作いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$2.40
出力生成された1Mトークンあたり$9.60
遅延最適化入力1Mプロンプトトークンあたり$3.00
遅延最適化出力生成された1Mトークンあたり$12.00
ウェブ検索(Linkup)呼び出し時の通話ごと$0.013

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "nova-pro-1-0", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0 = 決定論的、2 = 最大ランダム性。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。低い方が = より集中しています。·射程:0 – 1
max_tokens番号いいえ4096レスポンスには最大トークンを使います。·射程:1 – 65536
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
latency_optimizedブール値いいえ偽り品質コストを抑えつつ、より速いルーティングを好みます。
enable_latency_optimizedブール値いいえ偽り遅延最適化ルーティングを有効にして、より高速な応答を実現します。これは標準レートではなくカタログレイテンシー最適化レート(1Mトークンあたりの3.00入力/3.00入力/12.00出力)で請求されます。
web_search_linkupブール値いいえ偽りLinkupによるオプションのウェブ検索機能。有効化すると、最新のウェブソースが最新のユーザーメッセージをクエリとして取得し、モデルに追加のコンテキストとして提供されます。モデルの通常のトークンコストに加えて、リクエストごとに定額$0.013が加算されます。デフォルトで無効化されています。
disable_formattingブール値いいえ偽り有効化されると、Linkupウェブ検索を使用したアシスタント応答に「ソース」フッターを付け加えません。モデル出力が装飾を期待しない別のシステムに送られる場合に有用です。

注記

より高速な応答を得られるために、オプションの遅延最適化推論(Latency-Optimized Inference)を高コストで提供します。


Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/nova-pro-1-0