OpenAI Whisper 1

OpenAI Whisper 1
OpenAI · Transcription
POST /v1/audio/transcriptions

व्हिस्पर-1 speech-to-text ट्रांसक्रिप्शन को बहुभाषी पर्यवेक्षित ऑडियो पर प्रशिक्षित किया गया है, जिसमें प्रति फ़ाइल 25 एमबी अपलोड सीमा है।

एक नजर में

फ़ील्डमूल्य
मॉडल आईडीopenai-whisper-1
मॉडल रिलीज की तारीख2022-09-21
इनपुट तौर-तरीकेऑडियो
आउटपुट के तौर-तरीकेटेक्स्ट
संदर्भ विंडो-
वजन परिशुद्धता-
सुविधाऐंट्रांसक्रिप्शन, speech_to_text
मूल अनुमाननहीं
नयानहीं
समर्थित समापन बिंदुPOST /v1/audio/transcriptions

मूल्य निर्धारण

आवेशित करनायुक्तिदर
प्रति मिनट ऑडियोप्रति मिनट$0.030

उदाहरण अनुरोध

$curl https://api.empiriolabs.ai/v1/audio/transcriptions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -F model=openai-whisper-1 \
> -F file=@meeting.mp3

पैरामीटर

प्राचलप्रकारआवश्यकडिफ़ॉल्टया क़िस्‍म
fileतारहाँ-ऑडियो फ़ाइल (मल्टीपार्ट अपलोड) या JSON पथ के लिए file_url का उपयोग करें।
file_urlतारनहीं-ऑडियो लाने के लिए सार्वजनिक URL (फ़ाइल अपलोड के विकल्प)।
translateबूलियननहींगलतयदि सत्य है, तो स्रोत भाषा में ट्रांसक्रिप्ट करने के बजाय /audio/translations का मार्ग और अंग्रेजी में अनुवाद करें।
timestampsबूलियननहींगलतसुविधा टॉगल। यदि सत्य है, तो response_format=verbose_json सेट करता है और इसमें शब्द-स्तरीय timestamp_granularities शामिल होता है.
languageतारनहीं-वैकल्पिक ISO-639-1 भाषा कोड। यदि छोड़ दिया गया है तो स्वतः पता चल गया। अनुवाद करते समय अनदेखा किया जाता है = true।
promptतारनहीं-मॉडल को पूर्वाग्रह करने के लिए शब्दावली या पूर्व संदर्भ।
response_formatएनमनहीं"json"टाइमस्टैम्प = true को verbose_json करने के लिए ओवरराइड किया गया। · अनुमति: json, text, srt, verbose_json, vtt
temperatureसंख्यानहीं0.0नमूना तापमान। · रेंज: 0 - 1
timestamp_granularitiesतारनहीं-अल्पविराम से अलग सूची: शब्द, खंड। जब response_format=verbose_json का उपयोग किया जाता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/openai-whisper-1