Qwen3.5 122B-A10B

Qwen3.5 122B-A10B
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Qwen3.5 122B-A10Bは、256Kのコンテキスト、効率的なスパースMoE推論、テキスト、画像、ビデオ入力を持つマルチモーダル推論モデルです。

一目で

フィールド価値
モデルIDqwen3-5-122b-a10b
モデル発売日2026-02-24
入力モダリティテキスト、画像、ビデオ
出力モダリティ本文
コンテキストウィンドウ256K
重量精度-
最大出力トークン64,000
地域中国
特徴推論、ビジョン、web_search、function_calling、structured_output、マルチモーダル
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり<=128K $0.115(は$0.40);128K-256K $0.287($0.40だった)
出力生成された1Mトークンあたり<=128K $0.917(は$3.20);128K-256K $2.294($3.20だった)
ウェブ検索有効時のリクエストごと$0.01

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-5-122b-a10b", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·範囲:1 – 64000
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に論理を可能にしましょう。
thinking_budget番号いいえ32768思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 80000
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
vl_high_resolution_imagesブール値いいえ確かに画像入力には高解像度処理を使いましょう。
max_pixels番号いいえ2621440高解像度処理を無効にした場合の画像あたりの最大ピクセル数。·射程:4096 – 16777216
video_fps番号いいえ2映像入力からサンプリングするためのフレーム毎秒です。·範囲:0.1 – 10
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。有効になるとリクエストコストが$0.01増加します。

注記

テキスト、画像、ビデオ入力をサポートします。ウェブ検索はtool_web_searchで利用可能で、有効になるとリクエストごとに$0.01を追加します。思考トークンは出力トークンとして請求されます。


Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-5-122b-a10b