OpenAI Whisper 1

OpenAI Whisper 1
OpenAI · Transcription
POST /v1/audio/transcriptions

Whisper-1 speech-to-text Transkription, die auf mehrsprachiges, überwachtem Audio trainiert wurde, mit einem Upload-Limit von 25 MB pro Datei.

Auf einen Blick

SpielfeldWert
Modell-IDopenai-whisper-1
Modell-Veröffentlichungsdatum2022-09-21
EingabemodalitätenAudio
AusgabemodalitätenText
Kontextfenster-
Gewichtspräzision-
MerkmaleTranskription, speech_to_text
Native SchlussfolgerungNein
NeuNein
Unterstützte EndpunktePOST /v1/audio/transcriptions

Preisgestaltung

BerechnenSpezifikationZinssatz
Pro Minute Audiopro Minute$0.030

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=openai-whisper-1 \
> -F file=@meeting.mp3

Parameter

ParameterTypErforderlichDefaultBeschreibung
fileStringJa-Audiodatei (mehrteiliger Upload) ODER file_url für den JSON-Pfad verwenden.
file_urlStringNein-Öffentliche URL zum Abrufen von Audio (alternativ zum Dateihochladen).
translateBooleanNeinfalschWenn zutreffend, routen Sie zu /audio/translations und übersetzen Sie ins Englische, anstatt in der Quellsprache zu transkribieren.
timestampsBooleanNeinfalschConvenience-Schalter. Wenn zutreffend, setzt response_format=verbose_json und schließt Wortebene timestamp_granularities ein.
languageStringNein-Optionaler ISO-639-1-Sprachcode. Automatisch erkannt, wenn es weggelassen wird. Ignoriert, wenn übersetzen=wahr ist.
promptStringNein-Glossar oder vorheriger Kontext, um das Modell zu verzerren.
response_formatENUMNein"json"Überschrieben auf verbose_json, wenn Zeitstempel=wahr. · Erlaubt: json, text, srt, verbose_json, vtt
temperatureAnzahlNein0.0Temperatur wird geprochen. · Reichweite: 0 – 1
timestamp_granularitiesStringNein-Komma-getrennte Liste: Wort, Segment. Verwendet, wenn response_format=verbose_json.

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/openai-whisper-1.