Qwen3.5 Flash

POST /v1/chat/completionsModelo de visión y lenguaje con atención lineal híbrida más MoE escaso, contexto 1M y rápida inferencia multimodal de text/image/vídeo.
A simple vista
Precios
Solicitud de ejemplo
Parámetros
Notas
Herramientas integradas (solo se facturan cuando se invocan)
- Búsqueda web: $0.015/call
- Extractor de telarañas: gratis
- Intérprete de código: free
- Búsqueda de texto a imagen: $0.012/call
- Búsqueda imagen a imagen: $0.012/call
Otros
- Los tokens de pensamiento se presentan como tokens de salida
La búsqueda de texto a imagen y la búsqueda de imagen a imagen utilizan la fila de precios de búsqueda de imágenes. Cada búsqueda de imagen invocada se factura a la tasa indicada por llamada.
Facturación por herramienta (usage.tool_usage)
Cuando este modelo invoca herramientas (búsqueda web, intérprete de código, etc.) dentro de una sola petición, la respuesta lleva un mapa de usage.tool_usage normalizado junto con los conteos de tokens. El siguiente ejemplo muestra la forma - los nombres exactos de campos, unidades y qué herramientas aparecen pueden variar ligeramente según el proveedor:
El número de herramientas ya está en cost_usd - se perfilan para transparencia y así puedes auditar la facturación por herramienta. El campo se omite cuando no se invocan herramientas.
Variantes
:variant1
Precios
Parámetros
Machine-legible esquema: GET https://api.empiriolabs.ai/v1/models/qwen3-5-flash.
