Deepgram Nova 3

Deepgram Nova 3
Deepgram · Transcription
POST /v1/audio/transcriptions

Nova-3モデルを用いた音声・テキスト転写で、多言語対応と高度なカスタマイズ可能な設定を本番ワークロード向けに提供します。

一目で

フィールド価値
モデルIDdeepgram-nova-3
モデル発売日2025-02-12
入力モダリティ音声
出力モダリティ本文
コンテキストウィンドウ-
重量精度-
特徴書き起こし、speech_to_text
ネイティブ推論いいえ
新作いいえ
サポート端末POST /v1/audio/transcriptions

価格設定

チャージスペックレート
転写音声の1分あたり$0.014

例示リクエスト

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=deepgram-nova-3 \
> -F file=@meeting.mp3

パラメータ

パラメータ種類必須デフォルト概要
fileストリングいいえ-音声ファイル(mp3、wav、m4a、oggなど)はmultipart/form-dataとしてアップロードされました。
file_urlストリングいいえ-音声のURLを文字起こししてください。fileと相互排他的です。
smart_formatブール値いいえ確かに賢いフォーマット(大文字化、句読点付け、フォーマットnumbers/dates)を適用しましょう。
profanity_filterブール値いいえ偽り書き起こしの中の罵り言葉は****で隠してください。
numeralsブール値いいえ偽り話しかけられた数字を数字に変換します(例:「5」→「5」など)。
measurementsブール値いいえ偽り測定語を略語(例:「キログラム」→「キロ」)に変換してください。
languageエヌムいいえ"auto"ISO 639-1の言語コード。省略の場合は自動検出。·許可されている:autoenesfrdeitptjazhhirunl
redact_piiブール値いいえ偽り書き起こしには個人を特定できる情報は隠してください。
redact_pciブール値いいえ偽り成績証明書にマスク決済カード番号を入れてください。
keytermストリングいいえ-識別精度を高めるためにカンマ区切られたキーワード(専門用語、名前)を活用しています。
diarizeブール値いいえ偽り異なる話者を特定し、それぞれの発言に話者ラベルを付けます。
paragraphsブール値いいえ確かに発言は間や話者の交代に基づいて段落ごとにまとめられます。
dictationブール値いいえ偽り「ピリオド」「コンマ」「新しい行」といったコマンドをpunctuation/formattingとして解釈してください。
punctuateブール値いいえ確かにトランスクリプトに句読点を加えてください。
utterancesブール値いいえ偽り各発言をタイミングと自信を持って個別に返すこと。
generate_pdfブール値いいえ偽りtrueの場合は、DeepgramはJSONと一緒にPDFの書き起こしを返します。

注記

自動検出言語

英語、スペイン語、フランス語、ドイツ語、イタリア語、ポルトガル語、日本語、中国語、ヒンディー語、ロシア語、オランダ語。

カスタムキー用語

  • 英語のみ、合計≤500トークン
  • ドメイン固有の語彙の認識を向上させる

特徴の相互作用

  • ダイアリゼーションは発話を自動で有効化します
  • スマートフォーマットと段落自動句読点有効化
  • PCI/PIIの編集や罵り言葉のフィルターはデフォルトでオフです

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/deepgram-nova-3