Qwen3.7 Max | EmpirioLabs AI Docs

POST /v1/chat/completions

Qwen3.7 Max es un modelo de texto emblemático para programación, productividad, agentes de larga duración, pensamiento profundo, herramientas y contexto de 1M de tokens.

A simple vista

Campo	Valor
ID de modelo	`qwen3-7-max`
Fecha de lanzamiento del modelo	2026-05-21
Modalidades de entrada	Texto
Modalidades de salida	Texto
Ventana de contexto	1M
Precisión del peso	-
Tokens de salida máximo	65,536
Región	Singapur
Características	razonamiento, web_search, code_interpreter, function_calling, agentic_coding
Inferencia nativa	No
Nuevo	Sí
Puntos finales soportados	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Precios

Carga	Especificaciones	Tarifa
Entrada	por 1M de fichas de prompt	$2.50
Producción	por cada 1M de tokens generados	$7.50
Búsqueda en la web	por llamada cuando se invoca	$0.02
Extractor de telarañas	por llamada cuando se invoca	$0.02
Intérprete de código	por llamada cuando se invoca	$0.02

Solicitud de ejemplo

$ curl https://api.empiriolabs.ai/v1/chat/completions \
>   -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \
>   -H 'Content-Type: application/json' \
>   -d '{"model": "qwen3-7-max", "messages": [{"role":"user","content":"Hello"}]}'

Parámetros

Parámetro	Tipo	Obligatorio	Default	Descripción
`temperature`	Número	no	`0.7`	Temperatura de muestreo. 0 es determinista y 2 es la aleatoriedad máxima. · Rango: 0 – 2
`top_p`	Número	no	`0.9`	Masa de probabilidad de muestreo del núcleo. Valores bajos hacen que las salidas sean más enfocadas. · Rango: 0 – 1
`max_tokens`	Número	no	`4096`	Tokens de salida máximos. · Rango: 1 – 65536
`stop`	Cuerda	no	-	Hasta 4 cadenas donde el modelo dejará de generar más tokens.
`enable_thinking`	Booleano	no	Cierto	Habilita el razonamiento antes de responder.
`reasoning_effort`	enum	no	`"medium"`	Nivel de esfuerzo de razonamiento. Ninguno impide pensar. Presupuestos limitados de pensamiento de conjunto bajos, medios, altos y máximos, adaptados al modelo seleccionado. · Permitidos: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Número	no	`32768`	Se permiten tokens máximos reservados para razonar cuando se habilita el pensamiento. · Rango: 1 – 64000
`tool_web_search`	Booleano	no	falso	Busca información en tiempo real en internet. Añade $0.02 al coste de la solicitud por cada llamada de búsqueda web invocada.
`tool_web_extractor`	Booleano	no	falso	Extrae y lee contenido de las URLs. Requiere búsqueda en la web y reflexión. Añade $0.02 al coste de la solicitud por cada llamada invocada al extractor web.
`tool_code_interpreter`	Booleano	no	falso	Ejecuta código en Python en un sandbox. Requiere pensar. Añade $0.02 al coste de la solicitud por cada llamada al intérprete de código invocada.
`disable_formatting`	Booleano	no	falso	Devuelve la salida bruta al estilo proveedor sin el formato de código fuente de EmpirioLabs cuando esté soportado.

Notas

Solo entrada de texto. La búsqueda web, el extractor web y el intérprete de código son herramientas opcionales integradas expuestas a través de parámetros tool_*. Cada llamada a herramienta integrada añade $0.02 cuando se invoca. Los tokens de pensamiento se presentan como tokens de salida.

Facturación por herramienta (usage.tool_usage)

Cuando este modelo invoca herramientas integradas dentro de una sola petición, la respuesta lleva un mapa de usage.tool_usage normalizado junto a los recuentos de tokens. El número de herramientas ya está incluido en cost_usd y se presenta para mayor transparencia.

Variantes

`:variant1`

Campo	Valor
ID de modelo	`qwen3-7-max:variant1`
Fecha de lanzamiento del modelo	2026-05-21
Región	China
Ventana de contexto	1M
Precisión del peso	-
Tokens de salida máximo	65,536
Características	razonamiento, web_search, code_interpreter, function_calling, agentic_coding
Inferencia nativa	No
Puntos finales soportados	`POST /v1/chat/completions`, `POST /v1/responses`, `POST /v1/messages`

Precios

Carga	Especificaciones	Tarifa
Entrada	por 1M de fichas de prompt	$1.65 (era $2.50)
Producción	por cada 1M de tokens generados	$4.951 (era $7.50)
Búsqueda en la web	por llamada cuando se invoca	$0.01
Extractor de telarañas	por llamada cuando se invoca	$0.01
Intérprete de código	por llamada cuando se invoca	$0.01

Parámetros

Parámetro	Tipo	Obligatorio	Default	Descripción
`temperature`	Número	no	`0.7`	Temperatura de muestreo. 0 es determinista y 2 es la aleatoriedad máxima. · Rango: 0 – 2
`top_p`	Número	no	`0.9`	Masa de probabilidad de muestreo del núcleo. Valores bajos hacen que las salidas sean más enfocadas. · Rango: 0 – 1
`max_tokens`	Número	no	`4096`	Tokens de salida máximos. · Rango: 1 – 65536
`stop`	Cuerda	no	-	Hasta 4 cadenas donde el modelo dejará de generar más tokens.
`enable_thinking`	Booleano	no	Cierto	Habilita el razonamiento antes de responder.
`reasoning_effort`	enum	no	`"medium"`	Nivel de esfuerzo de razonamiento. Ninguno impide pensar. Presupuestos limitados de pensamiento de conjunto bajos, medios, altos y máximos, adaptados al modelo seleccionado. · Permitidos: `none`, `low`, `medium`, `high`, `max`
`thinking_budget`	Número	no	`32768`	Se permiten tokens máximos reservados para razonar cuando se habilita el pensamiento. · Rango: 1 – 64000
`tool_web_search`	Booleano	no	falso	Busca información en tiempo real en internet. Añade $0.01 al coste de la solicitud por cada llamada de búsqueda web invocada.
`tool_web_extractor`	Booleano	no	falso	Extrae y lee contenido de las URLs. Requiere búsqueda en la web y reflexión. Añade $0.01 al coste de la solicitud por cada llamada invocada al extractor web.
`tool_code_interpreter`	Booleano	no	falso	Ejecuta código en Python en un sandbox. Requiere pensar. Añade $0.01 al coste de la solicitud por cada llamada al intérprete de código invocada.
`disable_formatting`	Booleano	no	falso	Devuelve la salida bruta al estilo proveedor sin el formato de código fuente de EmpirioLabs cuando esté soportado.

Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/qwen3-7-max.