Qwen3.6 Flash | EmpirioLabs AI Docs

POST /v1/chat/completions

Fast Qwen3.6 エージェントコーディング、数学推論、空間理解、OCR、テキスト、画像、ビデオ入力のための視覚言語モデル。

一目で

フィールド	価値
モデルID	`qwen3-6-flash`
モデル発売日	2026-04-16
入力モダリティ	テキスト、画像、ビデオ
出力モダリティ	本文
コンテキストウィンドウ	1M
重量精度	-
最大出力トークン	65,536
地域	シンガポール
特徴	推論、ビジョン、映像、web_search、function_calling、structured_output、agentic_coding
ネイティブ推論	いいえ
新作	はい
サポート端末	`POST /v1/chat/completions`、`POST /v1/responses`、`POST /v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	<=256K $0.25;256K-1M $1.00
出力	生成された1Mトークンあたり	<=256K $1.50;256K-1M $4.00
ウェブ検索	クエリが有効時のクエリごと	$0.02

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`temperature`	番号	いいえ	`0.7`	サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
`top_p`	番号	いいえ	`0.9`	原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
`max_tokens`	番号	いいえ	`4096`	最大出力トークン。·射程:1 – 65536
`stop`	ストリング	いいえ	-	最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
`enable_thinking`	ブール値	いいえ	確かに	答える前に論理を可能にしましょう。
`reasoning_effort`	エヌム	いいえ	`"medium"`	推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:`none`、`low`、`medium`、`high`、`max`
`thinking_budget`	番号	いいえ	`32768`	思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 64000
`response_format`	目的	いいえ	-	OpenAI互換JSONモードまたはJSONスキーマ応答形式。厳密なスキーマにはノンシンキングモードを使いましょう。
`vl_high_resolution_images`	ブール値	いいえ	確かに	画像入力には高解像度処理を使いましょう。
`max_pixels`	番号	いいえ	`2621440`	高解像度処理を無効にした場合の画像あたりの最大ピクセル数。·射程:4096 – 16777216
`video_fps`	番号	いいえ	`2`	映像入力からサンプリングするためのフレーム毎秒です。·範囲:0.1 – 10
`tool_web_search`	ブール値	いいえ	偽り	リアルタイムの情報をウェブで検索しましょう。有効になるとリクエストコストが$0.02増加します。

注記

テキスト、画像、ビデオ入力をサポートします。ウェブ検索はtool_web_searchを通じて利用可能で、有効になるとクエリごとに$0.02を追加します。思考トークンは出力トークンとして請求されます。明示的なキャッシュ制御はサポートされていません。

バリエーション

`:variant1`

フィールド	価値
モデルID	`qwen3-6-flash:variant1`
モデル発売日	2026-04-16
地域	中国
コンテキストウィンドウ	1M
重量精度	-
最大出力トークン	65,536
特徴	推論、ビジョン、映像、web_search、function_calling、structured_output、agentic_coding
ネイティブ推論	いいえ
サポート端末	`POST /v1/chat/completions`、`POST /v1/responses`、`POST /v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	<=256K $0.165(は$0.25でした);256K-1M $0.66(以前は$1.00)
出力	生成された1Mトークンあたり	<=256K $0.99(は$1.50でした);256K-1M $3.961(以前は$4.00)
ウェブ検索	クエリが有効時のクエリごと	$0.01

パラメータ

パラメータ	種類	必須	デフォルト	概要
`temperature`	番号	いいえ	`0.7`	サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
`top_p`	番号	いいえ	`0.9`	原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
`max_tokens`	番号	いいえ	`4096`	最大出力トークン。·射程:1 – 65536
`stop`	ストリング	いいえ	-	最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
`enable_thinking`	ブール値	いいえ	確かに	答える前に論理を可能にしましょう。
`reasoning_effort`	エヌム	いいえ	`"medium"`	推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:`none`、`low`、`medium`、`high`、`max`
`thinking_budget`	番号	いいえ	`32768`	思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 128000
`response_format`	目的	いいえ	-	OpenAI互換JSONモードまたはJSONスキーマ応答形式。厳密なスキーマにはノンシンキングモードを使いましょう。
`vl_high_resolution_images`	ブール値	いいえ	確かに	画像入力には高解像度処理を使いましょう。
`max_pixels`	番号	いいえ	`2621440`	高解像度処理を無効にした場合の画像あたりの最大ピクセル数。·射程:4096 – 16777216
`video_fps`	番号	いいえ	`2`	映像入力からサンプリングするためのフレーム毎秒です。·範囲:0.1 – 10
`tool_web_search`	ブール値	いいえ	偽り	リアルタイムの情報をウェブで検索しましょう。有効になるとリクエストコストが$0.01増加します。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash。