Qwen3.5 Omni Plus

Qwen3.5 Omni Plus
Alibaba Cloud · Text Generation
POST /v1/chat/completions

النموذج الشامل للألعاب النارية للنص والصورة والصوت والفيديو 3h audio, 1h video, 90+ input and 30+ output languages, 55 voice timbres.

في لمحة

الميدانالقيمة
النموذجqwen3-5-omni-plus
تاريخ الإفراج النموذجي2026-03-30
طرائق المدخلاتالنص، التصوير، الفيديو، أوديو
طرائق النواتجالنص، أوديو
نافذة السياق256K
دقة الوزن-
الحد الأقصى للنواتج32,768
المنطقةسنغافورة
المعالمرؤية، سمعية، سمعية
Native inferenceلا
جديدةلا
نقاط النهاية المدعومةPOST /v1/chat/completions, POST /v1/responses, POST /v1/messages, POST /v1/audio/speech

الطباعة

الرسمSpecالمعدل
الناتج1Mلكل 1M رموز المطالبة $1.40؛ لكل 1M رموز مطالبة $11.00
الناتج1M المولدةلكل مليون رمز مولد $8.30؛ لكل مليون رمز مولد $44.00
Web searchلكل طلب$0.015

طلب مثال

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-5-omni-plus", "messages": [{"role":"user","content":"Hello"}]}'

البارامترات

البارامتراتالنوعالمطلوبةالتقصيرالوصف
temperatureالعددلا0.7درجة حرارة أخذ العينات صفر = محدد، 2 = أقصى عشوائي الرنج: صفر - 2
top_pالعددلا0.9نوكليوس أخذ عينات كتلة احتمالية أقل = أكثر تركيزا. الرنج: صفر - 1
max_tokensالعددلا4096الحد الأقصى للعلامات في الرد الرنج: 1-32768
output_modeenumلا"text"وضع تنسيق الإخراج. نص = نص فقط، الصوت = يشمل الكلام المركب الصناعي. · مسموح: text، text_audio
voiceسلسلةلا"Tina"الاسم الصوتي للناتج الصوتي (عندما يكون الناتج - رقم الصوت = الصوت).
tool_web_searchbooleanلاكاذبالسماح للنموذج بإجراء عمليات تفتيش على الشبكة عند الحاجة.
video_fpsالعددلا2تم أخذ عينة من شريط فيديو من أجل التحليل الرنج: 0.1 - 10
vl_high_resolution_imagesbooleanلاصحيحاستعملوا حلاً أعلى لصور المدخلات تفاصيل أفضل بكلفة أعلى
max_pixelsالعددلا2621440”أقصى ما يمكن” أكبر = المزيد من التفاصيل ولكن أبطأ/مزيد من الكسور الرنج: 1 - 99999999

الحواشي

** Audio billing**

  • Audio is billed at a higher token rate than text/image /video
  • عندما يُمكّن الناتج السمعي، لا يُحمّل نص الناتج - فقط مداخل صوتية

** صوت ولغة**

  • 55 ممرات صوتية متاحة
  • دعم إنتاج المواد السمعية 29 لغة، 7 لهجات

الفوترة لكل أداة (usage.tool_usage)

When this model invokeds tools (web search, code interpreter, etc.) inside a single request, the response carries a normalized EL usage.tool_usage map along the token counts. ويوضح المثال الوارد أدناه الشكل - الاسمان الميدانيان الدقيقان، والوحدات، والأدوات التي تظهر يمكن أن تختلف اختلافا طفيفا لكل مقدم:

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

يتم بالفعل احتساب عدد الأدوات في cost_usd - يتم إبراز الشفافية حتى تتمكن من تدقيق الفوترة لكل أداة. يتم حذف الحقل عندما لا يتم استدعاء أي أدوات.


مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/qwen3-5-omni-plus.