OpenAI Whisper 1

OpenAI Whisper 1
OpenAI · Transcription
POST /v1/audio/transcriptions

Whisper-1 speech-to-text transcription entraînée sur un audio supervisé multilingue, avec une limite de téléversement de 25 Mo par fichier.

En un coup d’œil

TerrainValeur
Identifiant de modèleopenai-whisper-1
Date de sortie du modèle2022-09-21
Modalités d’entréeAudio
Modalités de sortieTexte
Fenêtre de contexte-
Précision du poids-
Caractéristiquestranscription, speech_to_text
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/audio/transcriptions

Tarification

ChargeSpecTaux
Par minute d’audiopar minute$0.030

Exemple de demande

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=openai-whisper-1 \
> -F file=@meeting.mp3

Paramètres

ParamètreTypeObligatoirePar défautDescription
fileCordeOui-Fichier audio (téléversement en plusieurs parties) OU utiliser file_url pour le chemin JSON.
file_urlCordenon-URL publique pour récupérer l’audio (alternative au téléchargement de fichier).
translateBooléennonfauxSi c’est vrai, redirigez vers /audio/translations et traduisez en anglais au lieu de transcrire dans la langue source.
timestampsBooléennonfauxBascule de commodité. Si c’est vrai, les ensembles response_format=verbose_json et incluent les timestamp_granularities au niveau des mots.
languageCordenon-Code de langue ISO-639-1 optionnel. Détecté automatiquement s’il est omis. Ignoré quand traduire = vrai.
promptCordenon-Glossaire ou contexte préalable pour biaiser le modèle.
response_formatenumnon"json"Remplacé en verbose_json lorsque timestamps=true. · Autorisé: json, text, srt, verbose_json, vtt
temperatureNombrenon0.0Température d’échantillonnage. · Répartition: 0 – 1
timestamp_granularitiesCordenon-Liste séparée par virgules: mot, segment. Utilisé lorsque response_format=verbose_json.

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/openai-whisper-1.