Qwen3.5 Omni Plus | EmpirioLabs AI Docs

POST /v1/chat/completions

टेक्स्ट, छवि, ऑडियो और वीडियो के लिए फ्लैगशिप ओमनी-मोडल मॉडल। 3 घंटे ऑडियो, 1 घंटे वीडियो, 90 + इनपुट और 30 + आउटपुट भाषाएं, 55 आवाज का समय।

एक नजर में

फ़ील्ड	मूल्य
मॉडल आईडी	`qwen3-5-omni-plus`
मॉडल रिलीज की तारीख	2026-03-30
इनपुट तौर-तरीके	पाठ, छवि, वीडियो, ऑडियो
आउटपुट के तौर-तरीके	पाठ, ऑडियो
संदर्भ विंडो	256 के
वजन परिशुद्धता	-
अधिकतम आउटपुट टोकन	32,768
क्षेत्र	सिंगापुर
सुविधाऐं	दृष्टि, audio_in, audio_out, बहुभाषी
मूल अनुमान	नहीं
नया	नहीं
समर्थित समापन बिंदु	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`, `POST /v1/audio/speech`

मूल्य निर्धारण

आवेशित करना	युक्ति	दर
इनपुट	प्रति 1M प्रॉम्प्ट टोकन	प्रति 1M प्रॉम्प्ट टोकन $1.40; प्रति 1M प्रॉम्प्ट टोकन $11.00
उत्पादन	प्रति 1M जेनरेट किए गए टोकन	प्रति 1M उत्पन्न टोकन $8.30; प्रति 1M उत्पन्न टोकन $44.00
वेब खोज	प्रति अनुरोध	$0.015

उदाहरण अनुरोध

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-5-omni-plus", "messages": [{"role":"user","content":"Hello"}]}'

पैरामीटर

प्राचल	प्रकार	आवश्यक	डिफ़ॉल्ट	या क़िस्‍म
`temperature`	संख्या	नहीं	`0.7`	नमूना तापमान। 0 = नियतात्मक, 2 = अधिकतम यादृच्छिकता। · रेंज: 0 - 2
`top_p`	संख्या	नहीं	`0.9`	नाभिक नमूनाकरण संभाव्यता द्रव्यमान। निचला = अधिक केंद्रित। · रेंज: 0 - 1
`max_tokens`	संख्या	नहीं	`4096`	प्रतिक्रिया में अधिकतम टोकन। · रेंज: 1 - 32768
`output_mode`	एनम	नहीं	`"text"`	आउटपुट स्वरूप मोड। पाठ = केवल पाठ, ऑडियो = संश्लेषित भाषण शामिल करें। · अनुमति: `text`, `text_audio`
`voice`	तार	नहीं	`"Tina"`	ऑडियो आउटपुट के लिए आवाज का नाम (जब output_mode = ऑडियो)।
`tool_web_search`	बूलियन	नहीं	गलत	जरूरत पड़ने पर मॉडल को वेब खोज करने की अनुमति दें।
`video_fps`	संख्या	नहीं	`2`	विश्लेषण के लिए इनपुट वीडियो से फ्रेम्स-प्रति-सेकंड का नमूना लिया गया। · रेंज: 0.1 - 10
`vl_high_resolution_images`	बूलियन	नहीं	सच	इनपुट छवियों के लिए उच्च रिज़ॉल्यूशन का उपयोग करें। उच्च लागत पर बेहतर विवरण।
`max_pixels`	संख्या	नहीं	`2621440`	प्रति इनपुट छवि अधिकतम पिक्सेल। बड़ा = अधिक विवरण लेकिन धीमा/अधिक टोकन। · रेंज: 1 - 99999999

ऑडियो को text/image/वीडियो की तुलना में उच्च टोकन दर पर बिल किया जाता है
जब ऑडियो आउटपुट सक्षम किया जाता है, तो आउटपुट टेक्स्ट चार्ज नहीं होता है - केवल ऑडियो टोकन

आवाज और भाषा

55 वॉयस टिम्ब्रेस उपलब्ध हैं
ऑडियो आउटपुट 29 भाषाओं, 7 बोलियों का समर्थन करता है

प्रति-उपकरण बिलिंग (usage.tool_usage)

जब यह मॉडल एक ही अनुरोध के अंदर टूल (वेब खोज, कोड दुभाषिया, आदि) का आह्वान करता है, तो प्रतिक्रिया टोकन गणना के साथ एक सामान्यीकृत usage.tool_usage मानचित्र ले जाती है। नीचे दिया गया उदाहरण आकार दिखाता है - सटीक फ़ील्ड नाम, इकाइयाँ, और कौन से उपकरण दिखाई देते हैं, प्रति प्रदाता थोड़ा भिन्न हो सकते हैं:

1 "usage": {
2   "prompt_tokens": 123,
3   "completion_tokens": 456,
4   "cost_usd": 0.0042,
5   "tool_usage": {"web_search": 3, "code_interpreter": 1}
6 }

टूल काउंट पहले से ही cost_usd में फैक्टर किए गए हैं - वे पारदर्शिता के लिए सामने आए हैं ताकि आप प्रति-टूल बिलिंग का ऑडिट कर सकें। जब कोई उपकरण लागू नहीं किया गया था तो फ़ील्ड को छोड़ दिया जाता है।

Machine-पठनीय स्कीमा: GET https://api.empiriolabs.ai/v1/models/qwen3-5-omni-plus।

एक नजर में

मूल्य निर्धारण

उदाहरण अनुरोध

पैरामीटर

टिप्पणियाँ