Qwen3.5 Plus

Qwen3.5 Plus
Alibaba Cloud · Text Generation
POST /v1/chat/completions

テキスト、画像、動画を横断し、100万人のコンテキスト上で効率的な深い思考と視覚的理解を可能にするハイブリッドアーキテクチャのマルチモーダルモデル。

一目で

フィールド価値
モデルIDqwen3-5-plus
モデル発売日2026-02-16
入力モダリティテキスト、画像、ビデオ
出力モダリティ本文
コンテキストウィンドウ1M
重量精度-
最大出力トークン65,536
地域シンガポール
特徴ビジョン、web_search、code_interpreter、function_calling、推論
ネイティブ推論いいえ
新作いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり<=256K $0.36(は$0.40でした);256K-1M $1.08(以前は$1.20)
出力生成された1Mトークンあたり<=256K $2.21(は$2.40でした);256K-1M $6.62(以前は$7.20)
ウェブ検索通話あたり$0.015
画像検索通話あたり$0.012

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-5-plus", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0 = 決定論的、2 = 最大ランダム性。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。低い方が = より集中しています。·射程:0 – 1
max_tokens番号いいえ4096レスポンスには最大トークンを使います。·射程:1 – 65536
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
vl_high_resolution_imagesブール値いいえ確かに入力画像は高解像度で使いましょう。より詳細なものを高くして。
enable_thinkingブール値いいえ確かに拡張思考モードを有効にしてください。遅いですが、推論重視の作業は改善されます。
max_pixels番号いいえ2621440入力画像あたりの最大ピクセル数。大きいほど詳細は多いですが、遅い/トークン数が多いです。·射程:1 – 99999999
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。
tool_web_extractorブール値いいえ確かにURLからコンテンツを抽出し読み取ること。ウェブ検索と思考が必要です。
tool_code_interpreterブール値いいえ確かにサンドボックスでPythonコードを実行してください。考える必要がある。
tool_web_search_imageブール値いいえ確かにテキストの説明から画像をウェブで検索してください。
tool_image_searchブール値いいえ確かにアップロードされた画像から似た画像を見つけてください。
video_fps番号いいえ2入力映像からサンプル数をサンプリングして解析します。·範囲:0.1 – 10
treat_images_as_videoブール値いいえ偽り入力画像の連続を時間推論のためのビデオとして扱う。
disable_formattingブール値いいえ偽りEmpirioLabsのマークダウンフォーマット(引用[N])書き換え+ウェブ検索やツール使用時の参照ブロック)はスキップしてください。単純な[N]引用付きの生の上流回答が返されます。

注記

価格は256,000トークンを超えるinput/output3倍です。組み込みツール(ウェブ検索、ウェブエクストラクター、コードインタプリタ、画像検索)は、呼び出しされた時のみ請求されます。

テキストから画像への検索および画像から画像への検索は、画像検索の料金行を使用します。呼び出しされた画像検索は、その記載された通話1回あたりの料金で請求されます。

ツールごとの請求(usage.tool_usage)

このモデルが単一のリクエスト内でツール(ウェブ検索、コードインタプリタなど)を呼び出す場合、レスポンスにはトークン数とともに正規化されたusage.tool_usageマップが伴います。以下の例は形状を示しています。正確なフィールド名、単位、表示されるツールはプロバイダーによって若干異なります。

1"usage": {
2 "prompt_tokens": 123,
3 "completion_tokens": 456,
4 "cost_usd": 0.0042,
5 "tool_usage": {"web_search": 3, "code_interpreter": 1}
6}

ツール数はすでにcost_usdに含まれており、透明性を保つためにツールごとの請求を監査できるように表示されています。道具が使われていない場合はフィールドが省略されます。

バリエーション

:variant1

フィールド価値
モデルIDqwen3-5-plus:variant1
モデル発売日2026-02-16
地域中国
コンテキストウィンドウ1M
重量精度-
最大出力トークン65,536
特徴推論、ビジョン、映像、web_search、function_calling、structured_output、agentic_coding
ネイティブ推論いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり<=128K $0.115(は$0.36);128K-256K $0.287(0.36でした);256K-1M \0.573($1.08年)
出力生成された1Mトークンあたり<=128K $0.688(は$2.21);128K-256K $1.72(2.21でした);256K-1M \3.44($6.62年)
ウェブ検索クエリが有効時のクエリごと$0.01

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 65536
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に論理を可能にしましょう。
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
thinking_budget番号いいえ32768思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 80000
response_format目的いいえ-OpenAI互換JSONモードまたはJSONスキーマ応答形式。厳密なスキーマにはノンシンキングモードを使いましょう。
vl_high_resolution_imagesブール値いいえ確かに画像入力には高解像度処理を使いましょう。
max_pixels番号いいえ2621440高解像度処理を無効にした場合の画像あたりの最大ピクセル数。·射程:4096 – 16777216
video_fps番号いいえ2映像入力からサンプリングするためのフレーム毎秒です。·範囲:0.1 – 10
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。有効になるとリクエストコストが$0.01増加します。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-5-plus