Qwen3.7 Max

Qwen3.7 Max
Alibaba Cloud · Text Generation
POST /v1/chat/completions

Qwen3.7 Maxは、コーディング、生産性、長期エージェント、深い思考、ツール、1Mトークンコンテキストのための旗艦テキストモデルです。

一目で

フィールド価値
モデルIDqwen3-7-max
モデル発売日2026-05-21
入力モダリティ本文
出力モダリティ本文
コンテキストウィンドウ1M
重量精度-
最大出力トークン65,536
地域シンガポール
特徴理由、web_search、code_interpreter、function_calling、agentic_coding
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$2.50
出力生成された1Mトークンあたり$7.50
ウェブ検索呼び出し時の通話ごと$0.02
ウェブエクストラクター呼び出し時の通話ごと$0.02
コードインタプリタ呼び出し時の通話ごと$0.02

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 65536
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に論理を可能にしましょう。
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。·許可:nonelowmediumhighmax
thinking_budget番号いいえ32768思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 64000
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。呼び出すウェブ検索コールごとにリクエストコストが$0.02増加します。
tool_web_extractorブール値いいえ偽りURLからコンテンツを抽出し読み取ること。ウェブ検索と思考が必要です。呼び出しされたウェブエクストラクタ呼び出しごとにリクエストコストが$0.02増加します。
tool_code_interpreterブール値いいえ偽りサンドボックスでPythonコードを実行してください。考える必要がある。呼び出しされたコードインタプリタ呼び出しごとにリクエストコストが$0.02増加します。
disable_formattingブール値いいえ偽りEmpirioLabsのソースフォーマットを含まず、生のプロバイダースタイルの出力を返すことが可能です。

注記

テキスト入力のみです。ウェブ検索、ウェブエクストラクター、コードインタープリターは、tool_*パラメータを通じて公開されるオプションの組み込みツールです。各組み込みツール呼び出しは呼び出すと$0.02を追加します。思考トークンは出力トークンとして請求されます。

ツールごとの請求(usage.tool_usage)

このモデルが単一のリクエスト内で組み込みツールを呼び出す場合、レスポンスはトークン数とともに正規化されたusage.tool_usageマップを伴います。工具数はすでに計入されており、透明性を保つために表面化されていますcost_usd

バリエーション

:variant1

フィールド価値
モデルIDqwen3-7-max:variant1
モデル発売日2026-05-21
地域中国
コンテキストウィンドウ1M
重量精度-
最大出力トークン65,536
特徴理由、web_search、code_interpreter、function_calling、agentic_coding
ネイティブ推論いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$1.65(だった$2.50)
出力生成された1Mトークンあたり$4.951(だった$7.50)
ウェブ検索呼び出し時の通話ごと$0.01
ウェブエクストラクター呼び出し時の通話ごと$0.01
コードインタプリタ呼び出し時の通話ごと$0.01

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0は決定的で、2は最大のランダム性です。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。値が低いほど出力がより集中します。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 65536
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に論理を可能にしましょう。
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。·許可:nonelowmediumhighmax
thinking_budget番号いいえ32768思考時に推論のために確保される最大トークンが有効になっています。·範囲:1 – 64000
tool_web_searchブール値いいえ偽りリアルタイムの情報をウェブで検索しましょう。呼び出すウェブ検索コールごとにリクエストコストが$0.01増加します。
tool_web_extractorブール値いいえ偽りURLからコンテンツを抽出し読み取ること。ウェブ検索と思考が必要です。呼び出しされたウェブエクストラクタ呼び出しごとにリクエストコストが$0.01増加します。
tool_code_interpreterブール値いいえ偽りサンドボックスでPythonコードを実行してください。考える必要がある。呼び出しされたコードインタプリタ呼び出しごとにリクエストコストが$0.01増加します。
disable_formattingブール値いいえ偽りEmpirioLabsのソースフォーマットを含まず、生のプロバイダースタイルの出力を返すことが可能です。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max