DeepSeek V4 Flash

DeepSeek V4 Flash
DeepSeek · Text Generation
POST /v1/chat/completions

軽量なMoEモデルは、合計284B、アクティブパラメータ13B、ネイティブ1Mコンテキストを持ち、低レイテンシでコスト効率の高い高並行利用に最適化されています。

一目で

フィールド価値
モデルIDdeepseek-v4-flash
モデル発売日2026-04-24
入力モダリティ本文
出力モダリティ本文
コンテキストウィンドウ1M
重量精度-
最大出力トークン393,216
地域ドイツ
特徴理由
ネイティブ推論いいえ
新作はい
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$0.14
出力生成された1Mトークンあたり$0.28
ウェブ検索(Linkup)呼び出し時の通話ごと$0.013

例示リクエスト

$curl https://api.empiriolabs.ai/v1/chat/completions \
> -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
> -H 'Content-Type: application/json' \
> -d '{"model": "deepseek-v4-flash", "messages": [{"role":"user","content":"Hello"}]}'

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0 = 決定論的、2 = 最大ランダム性。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。低い方が = より集中しています。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 393216
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に、step-by-step理由をつけておきましょう。
thinking_budget番号いいえ32768推論プロセスのために最大トークンが予約されています。393216まで。·射程:1 – 393216
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
web_search_linkupブール値いいえ偽りLinkupによるオプションのウェブ検索機能。有効化すると、最新のウェブソースが最新のユーザーメッセージをクエリとして取得し、モデルに追加のコンテキストとして提供されます。モデルの通常のトークンコストに加えて、リクエストごとに定額$0.013が加算されます。デフォルトで無効化されています。
disable_formattingブール値いいえ偽り有効化されると、Linkupウェブ検索を使用したアシスタント応答に「ソース」フッターを付け加えません。モデル出力が装飾を期待しない別のシステムに送られる場合に有用です。

バリエーション

:variant1

フィールド価値
モデルIDdeepseek-v4-flash:variant1
モデル発売日2026-04-24
地域シンガポール
コンテキストウィンドウ1M
重量精度-
最大出力トークン393,216
特徴理由は、web_search
ネイティブ推論いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$0.20
出力生成された1Mトークンあたり$0.40
ウェブ検索有効時のリクエストごと$0.02

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0 = 決定論的、2 = 最大ランダム性。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。低い方が = より集中しています。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 393216
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に、step-by-step理由をつけておきましょう。
thinking_budget番号いいえ32768推論プロセスのために最大トークンが予約されています。393216まで。·射程:1 – 393216
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
tool_web_searchブール値いいえ偽りライブウェブ検索を有効にしてください。有効化するとリクエストコストに$0.02の追加料金が加算されます。

:variant2

フィールド価値
モデルIDdeepseek-v4-flash:variant2
モデル発売日2026-04-24
地域中国
コンテキストウィンドウ1M
重量精度-
最大出力トークン384,000
特徴推論、function_calling、web_search、キャッシュ
ネイティブ推論いいえ
サポート端末POST /v1/chat/completionsPOST /v1/responsesPOST /v1/messages

価格設定

チャージスペックレート
入力1Mプロンプトトークンあたり$0.138(だった$0.14)
出力生成された1Mトークンあたり$0.275(だった$0.28)
暗黙のキャッシュ読み取り1Mのキャッシュ入力トークンごとに$0.028
ウェブ検索有効時のリクエストごと$0.01

パラメータ

パラメータ種類必須デフォルト概要
temperature番号いいえ0.7サンプリング温度。0 = 決定論的、2 = 最大ランダム性。·射程:0 – 2
top_p番号いいえ0.9原子核サンプリング確率質量。低い方が = より集中しています。·射程:0 – 1
max_tokens番号いいえ4096最大出力トークン。·射程:1 – 393216
stopストリングいいえ-最大4つの文字列で、モデルはこれ以上のトークン生成を停止します。
enable_thinkingブール値いいえ確かに答える前に、step-by-step理由をつけておきましょう。
thinking_budget番号いいえ32768推論プロセスのために最大トークンが予約されています。393216まで。·射程:1 – 393216
reasoning_effortエヌムいいえ"medium"推論の努力レベル。誰も思考を妨げるものではありません。低、中、高、最大は選択したモデルに合わせて限定された思考予算を設定します。OpenAIスタイルのreasoning_effortフィールドとして送られ、モデルサービス用にenable_thinkingとthinking_budgetに翻訳されました。·許可:nonelowmediumhighmax
tool_web_searchブール値いいえ偽りライブウェブ検索を有効にしてください。有効になるとリクエストコストが$0.01増加します。

Machine-readable schema: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-flash