Deepgram Nova 3

Deepgram Nova 3
Deepgram · Transcription
POST /v1/audio/transcriptions

Transcripción de voz a texto usando el modelo Nova-3 con soporte multilingüe y ajustes avanzados personalizables para cargas de producción.

A simple vista

CampoValor
ID de modelodeepgram-nova-3
Fecha de lanzamiento del modelo2025-02-12
Modalidades de entradaAudio
Modalidades de salidaTexto
Ventana de contexto-
Precisión del peso-
Característicastranscripción, speech_to_text
Inferencia nativaNo
NuevoNo
Puntos finales soportadosPOST /v1/audio/transcriptions

Precios

CargaEspecificacionesTarifa
Transcripciónpor minuto de audio$0.014

Solicitud de ejemplo

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=deepgram-nova-3 \
> -F file=@meeting.mp3

Parámetros

ParámetroTipoObligatorioDefaultDescripción
fileCuerdano-Archivo de audio (mp3, wav, m4a, ogg, etc.) subido como multipart/form-data.
file_urlCuerdano-URL del audio para transcribir. Mutuamente excluyentes con file.
smart_formatBooleanonoCiertoAplica formato inteligente (capital, puntuación, formato numbers/dates).
profanity_filterBooleanonofalsoEnmascara palabras profanas en la transcripción con ****.
numeralsBooleanonofalsoConvierte los números hablados en dígitos (por ejemplo, “cinco” → “5”).
measurementsBooleanonofalsoConvierte palabras de medición en abreviaturas (por ejemplo, “kilogramos” → “kg”).
languageenumno"auto"Código de idioma ISO 639-1. Detecta automáticamente si se omite. · Permitidos: auto, en, es, fr, de, it, pt, ja, zh, hi, ru, nl
redact_piiBooleanonofalsoOculta información personal identificable en la transcripción.
redact_pciBooleanonofalsoEnmascarar los números de las tarjetas de pago en la transcripción.
keytermCuerdano-Términos clave separados por comas para mejorar la precisión del reconocimiento (jerga, nombres).
diarizeBooleanonofalsoIdentifica a diferentes hablantes y etiqueta cada enunciado con una etiqueta.
paragraphsBooleanonoCiertoAgrupa la salida en párrafos basados en pausas y giros de altavoz.
dictationBooleanonofalsoInterpreta comandos como “punto”, “coma”, “nueva línea” como punctuation/formatting.
punctuateBooleanonoCiertoAñade puntuación a la transcripción.
utterancesBooleanonofalsoResponde cada frase por separado, con el momento y la confianza.
generate_pdfBooleanonofalsoCuando es cierto, Deepgram devuelve una transcripción en PDF junto con el JSON.

Notas

Lenguajes autodetectados

Inglés, español, francés, alemán, italiano, portugués, japonés, chino, hindi, ruso, neerlandés.

Términos clave personalizados

  • Solo en inglés, ≤500 fichas en total
  • Mejora el reconocimiento del vocabulario específico de un dominio

Interacciones de características

  • La diarización habilita automáticamente los enunciados
  • El formato inteligente y los párrafos habilitan automáticamente la puntuación
  • PCI/PII redacción y filtro de palabrotas están desactivados por defecto

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/deepgram-nova-3.