OpenAI Whisper 1

OpenAI Whisper 1
OpenAI · Transcription
POST /v1/audio/transcriptions

Whisper-1speech-to-text多言語監督付き音声で学習された文字起こしで、ファイルあたりアップロード制限は25MBです。

一目で

フィールド価値
モデルIDopenai-whisper-1
モデル発売日2022-09-21
入力モダリティ音声
出力モダリティ本文
コンテキストウィンドウ-
重量精度-
特徴書き起こし、speech_to_text
ネイティブ推論いいえ
新作いいえ
サポート端末POST /v1/audio/transcriptions

価格設定

チャージスペックレート
音声1分あたり毎分$0.030

例示リクエスト

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=openai-whisper-1 \
> -F file=@meeting.mp3

パラメータ

パラメータ種類必須デフォルト概要
fileストリングはい-オーディオファイル(マルチパートアップロード)またはJSONパスにfile_urlを使う方法もあります。
file_urlストリングいいえ-音声取得用のパブリックURL(ファイルアップロードの代替)。
translateブール値いいえ偽りもしそうなら、/audio/translationsにルーティングして英語に翻訳し、元の言語で文字を書き起こすのではなく、
timestampsブール値いいえ偽り便利性の切り替え。もし真の場合、response_format=verbose_json を設定し、単語レベルのtimestamp_granularitiesも含みます。
languageストリングいいえ-オプションのISO-639-1言語コード。省略の場合は自動検出。translate=trueの場合は無視されます。
promptストリングいいえ-用語集や事前の文脈を参考にしてモデルに偏りをつけてください。
response_formatエヌムいいえ"json"タイムスタンプ=trueのときにverbose_jsonに上書きされます。·許可:jsontextsrtverbose_jsonvtt
temperature番号いいえ0.0サンプリング温度。·射程:0 – 1
timestamp_granularitiesストリングいいえ-カンマ区切りリスト:単語、セグメント。response_format=verbose_jsonの時に使用されます。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/openai-whisper-1