DeepSeek V4 Pro

DeepSeek · Text Generation
POST /v1/chat/completionsLLM MoE insignia con 1,6T totales / 49B parámetros activos y contexto nativo de 1M para matemáticas avanzadas, inferencia lógica y codificación especializada.
A simple vista
| Campo | Valor |
|---|---|
| ID de modelo | deepseek-v4-pro |
| Fecha de lanzamiento del modelo | 2026-04-24 |
| Modalidades de entrada | Texto |
| Modalidades de salida | Texto |
| Ventana de contexto | 1M |
| Precisión del peso | - |
| Tokens de salida máximo | 393,216 |
| Región | Alemania |
| Características | Razonamiento |
| Inferencia nativa | No |
| Nuevo | Sí |
| Puntos finales soportados | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Precios
| Carga | Especificaciones | Tarifa |
|---|---|---|
| Entrada | por 1M de fichas de prompt | $1.65 (era $1.74) |
| Producción | por cada 1M de tokens generados | $3.30 (era $3.48) |
| Búsqueda web (Linkup) | por llamada cuando se invoca | $0.013 |
Solicitud de ejemplo
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "deepseek-v4-pro", "messages": [{"role":"user","content":"Hello"}]}'
Parámetros
| Parámetro | Tipo | Obligatorio | Default | Descripción |
|---|---|---|---|---|
temperature | Número | no | 0.7 | Temperatura de muestreo. 0 = determinista, 2 = máxima aleatoriedad. · Rango: 0 – 2 |
top_p | Número | no | 0.9 | Masa de probabilidad de muestreo del núcleo. Más bajo = más enfocado. · Rango: 0 – 1 |
max_tokens | Número | no | 4096 | Tokens de salida máximos. · Rango: 1 – 393216 |
stop | Cuerda | no | - | Hasta 4 cadenas donde el modelo dejará de generar más tokens. |
enable_thinking | Booleano | no | Cierto | Activa step-by-step razonamiento antes de responder. |
thinking_budget | Número | no | 32768 | Tokens máximos reservados para el proceso de razonamiento. Hasta 393216. · Rango: 1 – 393216 |
reasoning_effort | enum | no | "medium" | Nivel de esfuerzo de razonamiento. Ninguno impide pensar. Presupuestos limitados de pensamiento de conjunto bajos, medios, altos y máximos, adaptados al modelo seleccionado. Enviado como un campo de reasoning_effort al estilo OpenAI, traducido a enable_thinking y thinking_budget para el servicio modelo. · Permitidos: none, low, medium, high, max |
web_search_linkup | Booleano | no | falso | Búsqueda web opcional impulsada por Linkup. Cuando están habilitadas, las fuentes web recientes se recuperan usando tu último mensaje de usuario como consulta y se proporcionan al modelo como contexto adicional. Añade una $0.013 fija por petición además del coste normal del token del modelo. Desactivado por defecto. |
disable_formatting | Booleano | no | falso | Cuando está habilitada, la pasarela no añadirá el pie de página “Fuentes” a las respuestas de los asistentes que utilizaron la búsqueda web de Linkup. Útil cuando la salida del modelo se transmite a otro sistema que no espera decoración. |
Variantes
:variant1
| Campo | Valor |
|---|---|
| ID de modelo | deepseek-v4-pro:variant1 |
| Fecha de lanzamiento del modelo | 2026-04-24 |
| Región | Singapur |
| Ventana de contexto | 1M |
| Precisión del peso | - |
| Tokens de salida máximo | 393,216 |
| Características | razonamiento, web_search |
| Inferencia nativa | No |
| Puntos finales soportados | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Precios
| Carga | Especificaciones | Tarifa |
|---|---|---|
| Entrada | por 1M de fichas de prompt | $2.40 |
| Producción | por cada 1M de tokens generados | $4.80 |
| Búsqueda en la web | por solicitud cuando está habilitado | $0.02 |
Parámetros
| Parámetro | Tipo | Obligatorio | Default | Descripción |
|---|---|---|---|---|
temperature | Número | no | 0.7 | Temperatura de muestreo. 0 = determinista, 2 = máxima aleatoriedad. · Rango: 0 – 2 |
top_p | Número | no | 0.9 | Masa de probabilidad de muestreo del núcleo. Más bajo = más enfocado. · Rango: 0 – 1 |
max_tokens | Número | no | 4096 | Tokens de salida máximos. · Rango: 1 – 393216 |
stop | Cuerda | no | - | Hasta 4 cadenas donde el modelo dejará de generar más tokens. |
enable_thinking | Booleano | no | Cierto | Activa step-by-step razonamiento antes de responder. |
thinking_budget | Número | no | 32768 | Tokens máximos reservados para el proceso de razonamiento. Hasta 393216. · Rango: 1 – 393216 |
reasoning_effort | enum | no | "medium" | Nivel de esfuerzo de razonamiento. Ninguno impide pensar. Presupuestos limitados de pensamiento de conjunto bajos, medios, altos y máximos, adaptados al modelo seleccionado. Enviado como un campo de reasoning_effort al estilo OpenAI, traducido a enable_thinking y thinking_budget para el servicio modelo. · Permitidos: none, low, medium, high, max |
tool_web_search | Booleano | no | falso | Activa la búsqueda web en directo. Añade un recargo $0.02 al coste de la solicitud cuando está activado. |
:variant2
| Campo | Valor |
|---|---|
| ID de modelo | deepseek-v4-pro:variant2 |
| Fecha de lanzamiento del modelo | 2026-04-24 |
| Región | China |
| Ventana de contexto | 1M |
| Precisión del peso | - |
| Tokens de salida máximo | 384,000 |
| Características | razonamiento, function_calling, web_search, caché |
| Inferencia nativa | No |
| Puntos finales soportados | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Precios
| Carga | Especificaciones | Tarifa |
|---|---|---|
| Entrada | por 1M de fichas de prompt | $1.65 (era $1.74) |
| Producción | por cada 1M de tokens generados | $3.301 (era $3.48) |
| Lectura implícita de caché | por cada 1M de tokens de entrada en caché | $0.138 |
| Búsqueda en la web | por solicitud cuando está habilitado | $0.01 |
Parámetros
| Parámetro | Tipo | Obligatorio | Default | Descripción |
|---|---|---|---|---|
temperature | Número | no | 0.7 | Temperatura de muestreo. 0 = determinista, 2 = máxima aleatoriedad. · Rango: 0 – 2 |
top_p | Número | no | 0.9 | Masa de probabilidad de muestreo del núcleo. Más bajo = más enfocado. · Rango: 0 – 1 |
max_tokens | Número | no | 4096 | Tokens de salida máximos. · Rango: 1 – 393216 |
stop | Cuerda | no | - | Hasta 4 cadenas donde el modelo dejará de generar más tokens. |
enable_thinking | Booleano | no | Cierto | Activa step-by-step razonamiento antes de responder. |
thinking_budget | Número | no | 32768 | Tokens máximos reservados para el proceso de razonamiento. Hasta 393216. · Rango: 1 – 393216 |
reasoning_effort | enum | no | "medium" | Nivel de esfuerzo de razonamiento. Ninguno impide pensar. Presupuestos limitados de pensamiento de conjunto bajos, medios, altos y máximos, adaptados al modelo seleccionado. Enviado como un campo de reasoning_effort al estilo OpenAI, traducido a enable_thinking y thinking_budget para el servicio modelo. · Permitidos: none, low, medium, high, max |
tool_web_search | Booleano | no | falso | Activa la búsqueda web en directo. Añade $0.01 al coste de la solicitud cuando está activado. |
Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/deepseek-v4-pro.
