Deepgram Nova 3

Deepgram Nova 3
Deepgram · Transcription
POST /v1/audio/transcriptions

उत्पादन कार्यभार के लिए बहु-भाषा समर्थन और उन्नत अनुकूलन योग्य सेटिंग्स के साथ नोवा -3 मॉडल का उपयोग करके भाषण-से-पाठ प्रतिलेखन।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीdeepgram-nova-3
मॉडल रिलीज की तारीख2025-02-12
इनपुट तौर-तरीकेऑडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो-
वजन परिशुद्धता-
सुविधाऐंट्रांसक्रिप्शन, speech_to_text
मूल अनुमाननहीं
नयानहीं
समर्थित समापन बिंदुPOST /v1/audio/transcriptions

मूल्य निर्धारण

आवेशित करनायुक्तिदर
प्रतिलेखनप्रति मिनट ऑडियो$0.014

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=deepgram-nova-3 \
> -F file=@meeting.mp3

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
fileतारनहीं-ऑडियो फ़ाइल (mp3, wav, m4a, ogg, आदि) multipart/form-data के रूप में अपलोड की गई।
file_urlतारनहीं-ट्रांसक्राइब करने के लिए ऑडियो का URL. file के साथ पारस्परिक रूप से अनन्य।
smart_formatबूलियननहींसचस्मार्ट स्वरूपण लागू करें (बड़े अक्षरों में लिखें, विराम चिह्न बनाएं, स्वरूपित करें numbers/dates).
profanity_filterबूलियननहींगलत**** के साथ प्रतिलेख में अपवित्र शब्दों को छिपाएं।
numeralsबूलियननहींगलतबोली जाने वाली संख्याओं को अंकों में बदलें (उदाहरण के लिए “पांच” → “5”)।
measurementsबूलियननहींगलतमाप शब्दों को संक्षिप्ताक्षरों में बदलें (उदाहरण के लिए “किलोग्राम” → “किलो”)।
languageएनमनहीं"auto"आईएसओ 639-1 भाषा कोड। यदि छोड़ दिया गया है तो ऑटो-डिटेक्ट करें। · अनुमति: auto, en, es, fr, de, it, pt, ja, zh, hi, ru, nl
redact_piiबूलियननहींगलतप्रतिलेख में व्यक्तिगत रूप से पहचान योग्य जानकारी को छिपाएं।
redact_pciबूलियननहींगलतप्रतिलेख में भुगतान कार्ड नंबर मास्क करें।
keytermतारनहीं-(शब्दजाल, नाम) के लिए पहचान सटीकता को बढ़ावा देने के लिए अल्पविराम से अलग किए गए प्रमुख शब्द।
diarizeबूलियननहींगलतअलग-अलग स्पीकर की पहचान करें और प्रत्येक उच्चारण को स्पीकर लेबल से टैग करें।
paragraphsबूलियननहींसचआउटपुट को विराम और स्पीकर टर्न के आधार पर पैराग्राफ में समूहित करें।
dictationबूलियननहींगलत”अवधि”, “अल्पविराम”, “नई पंक्ति” जैसे आदेशों की punctuation/formatting के रूप में व्याख्या करें।
punctuateबूलियननहींसचप्रतिलेख में विराम चिह्न जोड़ें।
utterancesबूलियननहींगलतप्रत्येक कथन को समय और आत्मविश्वास के साथ अलग से लौटाएं।
generate_pdfबूलियननहींगलतसच होने पर, Deepgram JSON के साथ एक पीडीएफ ट्रांसक्रिप्ट लौटाता है।

टिप्पणियाँ

ऑटो-डिटेक्ट की गई भाषाएँ

अंग्रेजी, स्पेनिश, फ्रेंच, जर्मन, इतालवी, पुर्तगाली, जापानी, चीनी, हिंदी, रूसी, डच।

कस्टम प्रमुख शर्तें

  • केवल अंग्रेजी, ≤500 टोकन कुल
  • डोमेन-विशिष्ट शब्दावली की पहचान में सुधार करता है

फ़ीचर इंटरैक्शन

  • डायराइजेशन ऑटो-इनेबल कथन को सक्षम बनाता है
  • स्मार्ट स्वरूप और पैराग्राफ विराम चिह्न स्वतः सक्षम करते हैं
  • PCI/PII संपादन और अपवित्रता फ़िल्टर डिफ़ॉल्ट रूप से बंद हैं

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/deepgram-nova-3