Qwen3.6 Flash

Qwen3.6 Flash
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Fast Qwen3.6 エージェントコーディング、数学推論、空間理解、OCR、テキスト、画像、ビデオ入力のための視覚言語モデル。

一目で

フィールド価値
モデルIDqwen3-6-flash
モデル発売日2026-04-16
入力モダリティテキスト、画像、ビデオ
出力モダリティ本文
コンテキストウィンドウ1M
重量精度-
最大出力トークン65,536
地域シンガポール
特徴推論、ビジョン、映像、web_search、function_calling、structured_output、agentic_coding
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり<=256K $0.25;256K-1M $1.00
出力生成された1Mトークンあたり<=256K $1.50;256K-1M $4.00
ウェブ検索クエリが有効時のクエリごと$0.02

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 65536
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に論理を可能にしましょう。
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
thinking_budget番号いいえ32768思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 64000
response_format目的いいえ-OpenAI互換JSONモードまたはJSONスキーマ応答形式。厳密なスキーマにはノンシンキングモードを使いましょう。
vl_high_resolution_imagesブール値いいえ確かに画像入力には高解像度処理を使いましょう。
max_pixels番号いいえ2621440高解像度処理を無効にした場合の画像あたりの最大ピクセル数。·射程:4096 – 16777216
video_fps番号いいえ2映像入力からサンプリングするためのフレーム毎秒です。·範囲:0.1 – 10
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。有効になるとリクエストコストが$0.02増加します。

注記

テキスト、画像、ビデオ入力をサポートします。ウェブ検索はtool_web_searchを通じて利用可能で、有効になるとクエリごとに$0.02を追加します。思考トークンは出力トークンとして請求されます。明示的なキャッシュ制御はサポートされていません。

バリエーション

:variant1

フィールド価値
モデルIDqwen3-6-flash:variant1
モデル発売日2026-04-16
地域中国
コンテキストウィンドウ1M
重量精度-
最大出力トークン65,536
特徴推論、ビジョン、映像、web_search、function_calling、structured_output、agentic_coding
ネイティブ推論いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり<=256K $0.165(は$0.25でした);256K-1M $0.66(以前は$1.00)
出力生成された1Mトークンあたり<=256K $0.99(は$1.50でした);256K-1M $3.961(以前は$4.00)
ウェブ検索クエリが有効時のクエリごと$0.01

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 65536
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に論理を可能にしましょう。
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
thinking_budget番号いいえ32768思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 128000
response_format目的いいえ-OpenAI互換JSONモードまたはJSONスキーマ応答形式。厳密なスキーマにはノンシンキングモードを使いましょう。
vl_high_resolution_imagesブール値いいえ確かに画像入力には高解像度処理を使いましょう。
max_pixels番号いいえ2621440高解像度処理を無効にした場合の画像あたりの最大ピクセル数。·射程:4096 – 16777216
video_fps番号いいえ2映像入力からサンプリングするためのフレーム毎秒です。·範囲:0.1 – 10
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。有効になるとリクエストコストが$0.01増加します。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash