Qwen3.5 Omni Plus

Alibaba Cloud · Text Generation
POST /v1/chat/completionsテキスト、画像、音声、ビデオのフラッグシップ・オムニモーダルモデル。3Hオーディオ、1Hビデオ、90+入力・30+出力言語、55種類の音声音色。
一目で
価格設定
例示リクエスト
パラメータ
注記
音声の表示
- 音声はtext/image/ビデオよりも高いトークン料金で請求されます
- オーディオ出力が有効の場合、出力テキストは課金されず、音声トークンのみが課金されます
声と言語
- 55音色が利用可能です
- 音声出力は29言語、7つの方言に対応しています
ツールごとの請求(usage.tool_usage)
このモデルが単一のリクエスト内でツール(ウェブ検索、コードインタプリタなど)を呼び出す場合、レスポンスにはトークン数とともに正規化されたusage.tool_usageマップが伴います。以下の例は形状を示しています。正確なフィールド名、単位、表示されるツールはプロバイダーによって若干異なります。
ツール数はすでにcost_usdに含まれており、透明性を保つためにツールごとの請求を監査できるように表示されています。道具が使われていない場合はフィールドが省略されます。
Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-5-omni-plus。
