Qwen3.7 Max | EmpirioLabs AI Docs

POST /v1/chat/completions

Qwen3.7 Maxは、コーディング、生産性、長期エージェント、深い思考、ツール、1Mトークンコンテキストのための旗艦テキストモデルです。

一目で

フィールド	価値
モデルID	`qwen3-7-max`
モデル発売日	2026-05-21
入力モダリティ	本文
出力モダリティ	本文
コンテキストウィンドウ	1M
重量精度	-
最大出力トークン	65,536
地域	シンガポール
特徴	理由、web_search、code_interpreter、function_calling、agentic_coding
ネイティブ推論	いいえ
新作	はい
サポート端末	`POST /v1/chat/completions`、`POST /v1/responses`、`POST /v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	$2.50
出力	生成された1Mトークンあたり	$7.50
ウェブ検索	呼び出し時の通話ごと	$0.02
ウェブエクストラクター	呼び出し時の通話ごと	$0.02
コードインタプリタ	呼び出し時の通話ごと	$0.02

例示リクエスト

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ	種類	必須	デフォルト	概要
`temperature`	番号	いいえ	`0.7`	サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
`top_p`	番号	いいえ	`0.9`	原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
`max_tokens`	番号	いいえ	`4096`	最大出力トークン。·射程:1 – 65536
`stop`	ストリング	いいえ	-	最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
`enable_thinking`	ブール値	いいえ	確かに	答える前に論理を可能にしましょう。
`reasoning_effort`	エヌム	いいえ	`"medium"`	推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。·許可:`none`、`low`、`medium`、`high`、`max`
`thinking_budget`	番号	いいえ	`32768`	思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 64000
`tool_web_search`	ブール値	いいえ	偽り	リアルタイムの情報をウェブで検索しましょう。呼び出すウェブ検索コールごとにリクエストコストが$0.02増加します。
`tool_web_extractor`	ブール値	いいえ	偽り	URLからコンテンツを抽出し読み取ること。ウェブ検索と思考が必要です。呼び出しされたウェブエクストラクタ呼び出しごとにリクエストコストが$0.02増加します。
`tool_code_interpreter`	ブール値	いいえ	偽り	サンドボックスでPythonコードを実行してください。考える必要がある。呼び出しされたコードインタプリタ呼び出しごとにリクエストコストが$0.02増加します。
`disable_formatting`	ブール値	いいえ	偽り	EmpirioLabsのソースフォーマットを含まず、生のプロバイダースタイルの出力を返すことが可能です。

注記

テキスト入力のみです。ウェブ検索、ウェブエクストラクター、コードインタープリターは、tool_*パラメータを通じて公開されるオプションの組み込みツールです。各組み込みツール呼び出しは呼び出すと$0.02を追加します。思考トークンは出力トークンとして請求されます。

ツールごとの請求(usage.tool_usage)

このモデルが単一のリクエスト内で組み込みツールを呼び出す場合、レスポンスはトークン数とともに正規化されたusage.tool_usageマップを伴います。工具数はすでに計入されており、透明性を保つために表面化されていますcost_usd。

バリエーション

`:variant1`

フィールド	価値
モデルID	`qwen3-7-max:variant1`
モデル発売日	2026-05-21
地域	中国
コンテキストウィンドウ	1M
重量精度	-
最大出力トークン	65,536
特徴	理由、web_search、code_interpreter、function_calling、agentic_coding
ネイティブ推論	いいえ
サポート端末	`POST /v1/chat/completions`、`POST /v1/responses`、`POST /v1/messages`

価格設定

チャージ	スペック	レート
入力	1Mプロンプトトークンあたり	$1.65(だった$2.50)
出力	生成された1Mトークンあたり	$4.951(だった$7.50)
ウェブ検索	呼び出し時の通話ごと	$0.01
ウェブエクストラクター	呼び出し時の通話ごと	$0.01
コードインタプリタ	呼び出し時の通話ごと	$0.01

パラメータ

パラメータ	種類	必須	デフォルト	概要
`temperature`	番号	いいえ	`0.7`	サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
`top_p`	番号	いいえ	`0.9`	原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
`max_tokens`	番号	いいえ	`4096`	最大出力トークン。·射程:1 – 65536
`stop`	ストリング	いいえ	-	最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
`enable_thinking`	ブール値	いいえ	確かに	答える前に論理を可能にしましょう。
`reasoning_effort`	エヌム	いいえ	`"medium"`	推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。·許可:`none`、`low`、`medium`、`high`、`max`
`thinking_budget`	番号	いいえ	`32768`	思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 64000
`tool_web_search`	ブール値	いいえ	偽り	リアルタイムの情報をウェブで検索しましょう。呼び出すウェブ検索コールごとにリクエストコストが$0.01増加します。
`tool_web_extractor`	ブール値	いいえ	偽り	URLからコンテンツを抽出し読み取ること。ウェブ検索と思考が必要です。呼び出しされたウェブエクストラクタ呼び出しごとにリクエストコストが$0.01増加します。
`tool_code_interpreter`	ブール値	いいえ	偽り	サンドボックスでPythonコードを実行してください。考える必要がある。呼び出しされたコードインタプリタ呼び出しごとにリクエストコストが$0.01増加します。
`disable_formatting`	ブール値	いいえ	偽り	EmpirioLabsのソースフォーマットを含まず、生のプロバイダースタイルの出力を返すことが可能です。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max。