Deepgram Nova 3

Deepgram Nova 3
Deepgram · Transcription
POST /v1/audio/transcriptions

Transcrição de fala para texto usando o modelo Nova-3 com suporte multilíngue e configurações avançadas personalizáveis para cargas de trabalho de produção.

De um olhar

CampoValor
ID do modelodeepgram-nova-3
Data de lançamento do modelo2025-02-12
Modalidades de entradaÁudio
Modalidades de saídaTexto
Janela de contexto-
Precisão do peso-
Característicastranscrição, speech_to_text
Inferência nativaNão
NovoNão
Endpoints suportadosPOST /v1/audio/transcriptions

Precificação

CargaEspecificaçãoTaxa
Transcriçãopor minuto de áudio$0.014

Exemplo de pedido

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=deepgram-nova-3 \
> -F file=@meeting.mp3

Parâmetros

ParâmetroTipoObrigatórioPadrãoDescrição
fileStringNão-Arquivo de áudio (mp3, wav, m4a, ogg, etc.) enviado como multipart/form-data.
file_urlStringNão-URL do áudio para transcrever. É mutuamente exclusivo com file.
smart_formatBooleanoNãoVerdadeAplique formatação inteligente (maiúscula, pontuação, formatação numbers/dates).
profanity_filterBooleanoNãofalsoMascarar palavras profanas na transcrição com ****.
numeralsBooleanoNãofalsoConverta números falados em dígitos (por exemplo, “cinco” → “5”).
measurementsBooleanoNãofalsoConverta palavras de medição em abreviações (por exemplo, “quilogramas” → “kg”).
languageenumNão"auto"Código de idioma ISO 639-1. Detecte automaticamente se for omitido. · Permitidos: auto, en, es, fr, de, it, pt, ja, zh, hi, ru, nl
redact_piiBooleanoNãofalsoMascarar informações pessoalmente identificáveis na transcrição.
redact_pciBooleanoNãofalsoMascarem os números dos cartões de pagamento na transcrição.
keytermStringNão-Termos-chave separados por vírgulas para aumentar a precisão do reconhecimento para (jargão, nomes).
diarizeBooleanoNãofalsoIdentifique diferentes falantes e marque cada enunciado com um rótulo de alto-falante.
paragraphsBooleanoNãoVerdadeAgrupe a saída em parágrafos com base em pausas e turnos de alto-falante.
dictationBooleanoNãofalsoInterprete comandos como “ponto”, “vírgula”, “nova linha” como punctuation/formatting.
punctuateBooleanoNãoVerdadeAdicione pontuação à transcrição.
utterancesBooleanoNãofalsoResponda cada declaração separadamente, com timing e confiança.
generate_pdfBooleanoNãofalsoQuando verdade, o Deepgram retorna uma transcrição em PDF junto com o JSON.

Notas

Línguas auto-detectadas

Inglês, espanhol, francês, alemão, italiano, português, japonês, chinês, hindi, russo, holandês.

Termos-chave personalizados

  • Apenas em inglês, ≤500 tokens no total
  • Melhora o reconhecimento do vocabulário específico do domínio

Interações com características

  • A diarização habilita automaticamente enunciados
  • Formatação inteligente e parágrafos ativam automaticamente a pontuação
  • PCI/PII redação e filtro de palavrões estão desligados por padrão

Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/deepgram-nova-3.