OpenAI Whisper 1 | EmpirioLabs AI Docs

OpenAI · Transcription

POST /v1/audio/transcriptions

व्हिस्पर-1 speech-to-text ट्रांसक्रिप्शन को बहुभाषी पर्यवेक्षित ऑडियो पर प्रशिक्षित किया गया है, जिसमें प्रति फ़ाइल 25 एमबी अपलोड सीमा है।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`openai-whisper-1`
मॉडल रिलीज की तारीख	2022-09-21
इनपुट तौर-तरीके	ऑडियो
आउटपुट के तौर-तरीके	टेक्स्ट
संदर्भ विंडो	-
वजन परिशुद्धता	-
सुविधाऐं	ट्रांसक्रिप्शन, speech_to_text
मूल अनुमान	नहीं
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/audio/transcriptions`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
प्रति मिनट ऑडियो	प्रति मिनट	$0.030

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/audio/transcriptions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -F model=openai-whisper-1 \
>   -F file=@meeting.mp3

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`file`	तार	हाँ	-	ऑडियो फ़ाइल (मल्टीपार्ट अपलोड) या JSON पथ के लिए file_url का उपयोग करें।
`file_url`	तार	नहीं	-	ऑडियो लाने के लिए सार्वजनिक URL (फ़ाइल अपलोड के विकल्प)।
`translate`	बूलियन	नहीं	गलत	यदि सत्य है, तो स्रोत भाषा में ट्रांसक्रिप्ट करने के बजाय /audio/translations का मार्ग और अंग्रेजी में अनुवाद करें।
`timestamps`	बूलियन	नहीं	गलत	सुविधा टॉगल। यदि सत्य है, तो response_format=verbose_json सेट करता है और इसमें शब्द-स्तरीय timestamp_granularities शामिल होता है.
`language`	तार	नहीं	-	वैकल्पिक ISO-639-1 भाषा कोड। यदि छोड़ दिया गया है तो स्वतः पता चल गया। अनुवाद करते समय अनदेखा किया जाता है = true।
`prompt`	तार	नहीं	-	मॉडल को पूर्वाग्रह करने के लिए शब्दावली या पूर्व संदर्भ।
`response_format`	एनम	नहीं	`"json"`	टाइमस्टैम्प = true को verbose_json करने के लिए ओवरराइड किया गया। · अनुमति: `json`, `text`, `srt`, `verbose_json`, `vtt`
`temperature`	संख्या	नहीं	`0.0`	नमूना तापमान। · रेंज: 0 - 1
`timestamp_granularities`	तार	नहीं	-	अल्पविराम से अलग सूची: शब्द, खंड। जब response_format=verbose_json का उपयोग किया जाता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/openai-whisper-1।