Deepgram Nova 3

Deepgram Nova 3
Deepgram · Transcription
POST /v1/audio/transcriptions

Sprach-zu-Text-Transkription mit dem Nova-3-Modell mit mehrsprachiger Unterstützung und fortschrittlichen anpassbaren Einstellungen für Produktionsarbeitslasten.

Auf einen Blick

SpielfeldWert
Modell-IDdeepgram-nova-3
Modell-Veröffentlichungsdatum2025-02-12
EingabemodalitätenAudio
AusgabemodalitätenText
Kontextfenster-
Gewichtspräzision-
MerkmaleTranskription, speech_to_text
Native SchlussfolgerungNein
NeuNein
Unterstützte EndpunktePOST /v1/audio/transcriptions

Preisgestaltung

BerechnenSpezifikationZinssatz
Transkriptionpro Minute Audio$0.014

Beispielanfrage

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=deepgram-nova-3 \
> -F file=@meeting.mp3

Parameter

ParameterTypErforderlichDefaultBeschreibung
fileStringNein-Audiodatei (mp3, wav, m4a, ogg usw.) wurde als multipart/form-data hochgeladen.
file_urlStringNein-URL des zu transkribierenden Audios. Mit file ist das gegenseitig ausgeschlossen.
smart_formatBooleanNeinStimmtWende intelligente Formatierung an (Großschreibung, Zeichensetzung, Formatierung numbers/dates).
profanity_filterBooleanNeinfalschMaskiere obskane Wörter im Transkript mit ****.
numeralsBooleanNeinfalschSprechende Zahlen in Ziffern umwandeln (z. B. “fünf” → “5”).
measurementsBooleanNeinfalschUmwandeln Sie Messwörter in Abkürzungen (z. B. “kilogramm” → “kg”).
languageENUMNein"auto"ISO 639-1 Sprachcode. Automatische Erkennung, wenn es ausgelassen wird. · Erlaubt: auto, en, es, fr, de, it, pt, ja, zh, hi, ru, nl
redact_piiBooleanNeinfalschMaskiere persönlich identifizierbare Informationen im Transkript.
redact_pciBooleanNeinfalschMaskieren Sie die Zahlungskartennummern im Transkript.
keytermStringNein-Komma-getrennte Schlüsselbegriffe, um die Erkennungsgenauigkeit für (Fachjargon, Namen) zu verbessern.
diarizeBooleanNeinfalschIdentifizieren Sie verschiedene Sprecher und markieren Sie jede Äußerung mit einem Sprecherlabel.
paragraphsBooleanNeinStimmtGruppiere die Ausgaben in Absätze, basierend auf Pausen und Sprecherwechseln.
dictationBooleanNeinfalschInterpretiere Befehle wie “Punkt”, “Komma”, “neue Zeile” als punctuation/formatting.
punctuateBooleanNeinStimmtFüge dem Zeugnis Satzzeichen hinzu.
utterancesBooleanNeinfalschErwidern Sie jede Äußerung einzeln, zeitlich und mit Zuversicht.
generate_pdfBooleanNeinfalschWenn das stimmt, liefert Deepgram zusammen mit dem JSON ein PDF-Transkript.

Anmerkungen

Automatisch erkannte Sprachen

Englisch, Spanisch, Französisch, Deutsch, Italienisch, Portugiesisch, Japanisch, Chinesisch, Hindi, Russisch, Niederländisch.

Benutzerdefinierte Schlüsselbegriffe

  • Nur auf Englisch, insgesamt ≤500 Token
  • Verbessert die Erkennung des domänenspezifischen Vokabulars

Funktionswechselwirkungen

  • Tagebuchbildung aktiviert automatisch Äußerungen
  • Smart Format und Absätze aktivieren automatisch die Zeichensetzung
  • PCI/PII Schwärzungs- und Fluchenfilter sind standardmäßig ausgeschaltet

Machine-lesbares Schema: GET https://api.empiriolabs.ai/v1/models/deepgram-nova-3.