Nova Pro 1.0

Amazon · Text Generation

POST /v1/chat/completions

30万のコンテキスト(最大~30分の動画)におけるテキスト、画像、動画の精度、速度、コストのマルチモーダル基礎モデルのバランス。

一目で

フィールド	価値
モデルID	`nova-pro-1-0`
モデル発売日	2024-12-03
入力モダリティ	テキスト、画像、ビデオ
出力モダリティ	本文
コンテキストウィンドウ	30万
重量精度	-
最大出力トークン	5,000
特徴	ビジョン
ネイティブ推論	いいえ
新作	いいえ
サポート端末	`POST /v1/chat/completions`、`POST /v1/responses`、`POST /v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	$2.40
出力	生成された1Mトークンあたり	$9.60
遅延最適化入力	1Mプロンプトトークンあたり	$3.00
遅延最適化出力	生成された1Mトークンあたり	$12.00
ウェブ検索(Linkup)	呼び出し時の通話ごと	$0.013

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "nova-pro-1-0", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`temperature`	番号	いいえ	`0.7`	サンプリング温度。0 = 決定論的、2 = 最大ランダム性。·射程:0 – 2
`top_p`	番号	いいえ	`0.9`	原子核サンプリング確率質量。低い方が = より集中しています。·射程:0 – 1
`max_tokens`	番号	いいえ	`4096`	レスポンスには最大トークンを使います。·射程:1 – 65536
`stop`	ストリング	いいえ	-	最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
`latency_optimized`	ブール値	いいえ	偽り	品質コストを抑えつつ、より速いルーティングを好みます。
`enable_latency_optimized`	ブール値	いいえ	偽り	遅延最適化ルーティングを有効にして、より高速な応答を実現します。これは標準レートではなくカタログレイテンシー最適化レート(1Mトークンあたりの $3.00入力/$ 12.00出力)で請求されます。
`web_search_linkup`	ブール値	いいえ	偽り	Linkupによるオプションのウェブ検索機能。有効化すると、最新のウェブソースが最新のユーザーメッセージをクエリとして取得し、モデルに追加のコンテキストとして提供されます。モデルの通常のトークンコストに加えて、リクエストごとに定額$0.013が加算されます。デフォルトで無効化されています。
`disable_formatting`	ブール値	いいえ	偽り	有効化されると、Linkupウェブ検索を使用したアシスタント応答に「ソース」フッターを付け加えません。モデル出力が装飾を期待しない別のシステムに送られる場合に有用です。

注記

より高速な応答を得られるために、オプションの遅延最適化推論(Latency-Optimized Inference)を高コストで提供します。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/nova-pro-1-0。