Deepgram Nova 3

Deepgram Nova 3
Deepgram · Transcription
POST /v1/audio/transcriptions

La transcription vocale en texte utilisant le modèle Nova-3 avec prise en charge multilingue et réglages avancés personnalisables pour les charges de production.

En un coup d’œil

TerrainValeur
Identifiant de modèledeepgram-nova-3
Date de sortie du modèle2025-02-12
Modalités d’entréeAudio
Modalités de sortieTexte
Fenêtre de contexte-
Précision du poids-
Caractéristiquestranscription, speech_to_text
Inférence autochtoneNon
NouveauNon
Points de terminaison pris en chargePOST /v1/audio/transcriptions

Tarification

ChargeSpecTaux
Transcriptionpar minute d’audio$0.014

Exemple de demande

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=deepgram-nova-3 \
> -F file=@meeting.mp3

Paramètres

ParamètreTypeObligatoirePar défautDescription
fileCordenon-Fichier audio (mp3, wav, m4a, ogg, etc.) téléchargé en tant que multipart/form-data.
file_urlCordenon-URL de l’audio à transcrire. Incompatibles avec file.
smart_formatBooléennonVraiAppliquez une mise en forme intelligente (mettez en majuscules, ponctuez, formatez numbers/dates).
profanity_filterBooléennonfauxMasquez les mots grossiers dans la transcription avec ****.
numeralsBooléennonfauxConvertir les numéros parlés en chiffres (par exemple « cinq » → « 5 »).
measurementsBooléennonfauxConvertir les mots de mesure en abréviations (par exemple « kilogrammes » → « kg »).
languageenumnon"auto"Code linguistique ISO 639-1. Détecte automatiquement si tu n’as pas été utilisé. · Autorisé: auto, en, es, fr, de, it, pt, ja, zh, hi, ru, nl
redact_piiBooléennonfauxMasquez les informations personnelles identifiables dans la transcription.
redact_pciBooléennonfauxMasquez les numéros de carte de paiement dans la transcription.
keytermCordenon-Des termes clés séparés par des virgules pour améliorer la précision de la reconnaissance (jargon, noms).
diarizeBooléennonfauxIdentifiez les différents locuteurs et étiquetez chaque énoncé avec une étiquette de haut-parleur.
paragraphsBooléennonVraiRegroupez la sortie en paragraphes selon les pauses et les tours de l’orateur.
dictationBooléennonfauxInterprétez des commandes comme « point », « virgule », « nouvelle ligne » comme punctuation/formatting.
punctuateBooléennonVraiAjoutez la ponctuation à la transcription.
utterancesBooléennonfauxRépondez à chaque énoncé séparément, avec timing et confiance.
generate_pdfBooléennonfauxLorsque c’est vrai, Deepgram renvoie une transcription PDF avec le JSON.

Notes

Langues auto-détectées

Anglais, espagnol, français, allemand, italien, portugais, japonais, chinois, hindi, russe, néerlandais.

Termes clés personnalisés

  • En anglais uniquement, ≤500 jetons au total
  • Améliore la reconnaissance du vocabulaire spécifique au domaine

Interactions avec les fonctionnalités

  • La diarisation permet automatiquement les énoncés
  • Le format intelligent et les paragraphes activent automatiquement la ponctuation
  • PCI/PII filtre de rédaction et de vulgarisation sont désactivés par défaut

_Machine schéma lisible: _ GET https://api.empiriolabs.ai/v1/models/deepgram-nova-3.