Qwen3.5 Omni Flash

Alibaba Cloud · Text Generation
POST /v1/chat/completionsمناولة النصوص والصورة والصوت والفيديو ذات الكفاءة من حيث التكلفة، بما يصل إلى 3 ساعات من الصوت وساعة واحدة من الفيديو عبر 90 + اللغات.
في لمحة
الطباعة
طلب مثال
البارامترات
الحواشي
** Audio billing**
- Audio is billed at a higher token rate than text/image /video
- عندما يُمكّن الناتج السمعي، لا يُحمّل نص الناتج - فقط مداخل صوتية
** صوت ولغة**
- 55 ممرات صوتية متاحة
- دعم إنتاج المواد السمعية 29 لغة، 7 لهجات
الفوترة لكل أداة (usage.tool_usage)
When this model invokeds tools (web search, code interpreter, etc.) inside a single request, the response carries a normalized EL usage.tool_usage map along the token counts. ويوضح المثال الوارد أدناه الشكل - الاسمان الميدانيان الدقيقان، والوحدات، والأدوات التي تظهر يمكن أن تختلف اختلافا طفيفا لكل مقدم:
يتم بالفعل احتساب عدد الأدوات في cost_usd - يتم إبراز الشفافية حتى تتمكن من تدقيق الفوترة لكل أداة. يتم حذف الحقل عندما لا يتم استدعاء أي أدوات.
مخطط Machine قابل للقراءة: GET https://api.empiriolabs.ai/v1/models/qwen3-5-omni-flash.
