Deepgram Nova 3

Deepgram Nova 3
Deepgram · Transcription
POST /v1/audio/transcriptions

采用Nova-3模型进行语音转文字转录,支持多语言支持,并可为生产工作负载提供高级可定制设置。

一眼看

场地价值
型号IDdeepgram-nova-3
车型发布日期2025-02-12
输入模态音频
输出模态正文
上下文窗口-
重量精度-
特色转录,speech_to_text
本土推断
支持的端点POST /v1/audio/transcriptions

定价

冲锋规格速率
转录每分钟音频$0.014

示例请求

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=deepgram-nova-3 \
> -F file=@meeting.mp3

参数

参数类型必修默认描述
file-音频文件(mp3、wav、m4a、ogg等)以multipart/form-data形式上传。
file_url-音频的网址以便转录。与file互斥。
smart_format布尔值确实如此应用智能格式化(大写、标点、格式numbers/dates)。
profanity_filter布尔值错误在记录中用****遮盖脏话。
numerals布尔值错误将口语数字转换为数字(例如“五”→“5”)。
measurements布尔值错误将测量词转换为缩写(例如“kilograms”→“kg”)。
language枚举"auto"ISO 639-1语言代码。如果省略了,则自动检测。·允许:autoenesfrdeitptjazhhirunl
redact_pii布尔值错误在笔录中掩盖个人身份信息。
redact_pci布尔值错误成绩单上要写口罩支付卡号。
keyterm-用逗号分隔的关键词来提高识别准确率(术语、名称)。
diarize布尔值错误识别不同的发言者,并为每个发言人标签。
paragraphs布尔值确实如此根据停顿和发言人转向,将输出分成段落。
dictation布尔值错误把“句号”、“逗号”、“换行”等命令理解为punctuation/formatting。
punctuate布尔值确实如此在文字记录中添加标点符号。
utterances布尔值错误每句话都要分别回应,时机和信心都要把握。
generate_pdf布尔值错误如果属实,Deepgram会返回一份PDF文字记录和JSON。

注释

自动检测语言

英语、西班牙语、法语、德语、意大利语、葡萄牙语、日语、中文、印地语、俄语、荷兰语。

自定义关键词

  • 仅限英语,总共≤500代币
  • 提升对领域特定词汇的识别

特征交互

  • 日语化自动启用话语
  • 智能格式和段落自动启用标点符号
  • PCI/PII遮蔽和脏话过滤默认关闭

Machine可读模式: GET https://api.empiriolabs.ai/v1/models/deepgram-nova-3