Qwen3.6 Flash

Alibaba Cloud · Text Generation
POST /v1/chat/completionsModelo de visão rápido Qwen3.6 para codificação agente, raciocínio matemático, compreensão espacial, OCR, e entrada de texto, imagem e vídeo.
De um olhar
| Campo | Valor |
|---|---|
| ID do modelo | qwen3-6-flash |
| Data de lançamento do modelo | 2026-04-16 |
| Modalidades de entrada | Texto, Imagem, Vídeo |
| Modalidades de saída | Texto |
| Janela de contexto | 1M |
| Precisão do peso | - |
| Tokens de saída máxima | 65,536 |
| Região | Singapura |
| Características | raciocínio, visão, vídeo, web_search, function_calling, structured_output, agentic_coding |
| Inferência nativa | Não |
| Novo | Sim |
| Endpoints suportados | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Precificação
| Carga | Especificação | Taxa |
|---|---|---|
| Entrada | por 1M de tokens de prompt | <=256K $0.25; 256K-1M $1.00 |
| Produção | por 1M de tokens gerados | <=256K $1.50; 256K-1M $4.00 |
| Busca na web | por consulta quando ativada | $0.02 |
Exemplo de pedido
$ curl https://api.empiriolabs.ai/v1/chat/completions \ > -H 'Authorization: Bearer $EMPIRIOLABS_API_KEY' \ > -H 'Content-Type: application/json' \ > -d '{"model": "qwen3-6-flash", "messages": [{"role":"user","content":"Hello"}]}'
Parâmetros
| Parâmetro | Tipo | Obrigatório | Padrão | Descrição |
|---|---|---|---|---|
temperature | Número | Não | 0.7 | Temperatura de amostragem. 0 é determinístico e 2 é a aleatoriedade máxima. · Intervalo: 0 – 2 |
top_p | Número | Não | 0.9 | Amostragem do núcleo com a probabilidade de massa. Valores mais baixos tornam as saídas mais focadas. · Intervalo: 0 – 1 |
max_tokens | Número | Não | 4096 | Tokens de saída máximos. · Intervalo: 1 – 65536 |
stop | String | Não | - | Até 4 strings em que o modelo para de gerar mais tokens. |
enable_thinking | Booleano | Não | Verdade | Ative o raciocínio antes de responder. |
reasoning_effort | enum | Não | "medium" | Nível de esforço de raciocínio. Nenhum impede o pensamento. orçamentos limitados de pensamento de conjuntos baixos, médios, altos e máximos, dimensionados para o modelo selecionado. Enviado como um campo de reasoning_effort estilo OpenAI, traduzido em enable_thinking e thinking_budget para o serviço modelo. · Permitido: none, low, medium, high, max |
thinking_budget | Número | Não | 32768 | Tokens máximos reservados para raciocínio quando o pensamento está ativado. · Intervalo: 1 – 64000 |
response_format | Objeto | Não | - | Modo JSON compatível com OpenAI ou formato de resposta de esquema JSON. Use o modo não-pensar para esquemas estritos. |
vl_high_resolution_images | Booleano | Não | Verdade | Use processamento de resolução mais alta para entradas de imagem. |
max_pixels | Número | Não | 2621440 | Contagem máxima de pixels por imagem quando o processamento de alta resolução está desativado. · Intervalo: 4096 – 16777216 |
video_fps | Número | Não | 2 | Frames por segundo para amostrar a partir das entradas de vídeo. · Alcance: 0,1 – 10 |
tool_web_search | Booleano | Não | falso | Pesquise na internet por informações em tempo real. Adiciona $0.02 ao custo da solicitação quando ativado. |
Notas
Suporta entrada de texto, imagem e vídeo. A busca na web está disponível via tool_web_search e adiciona $0.02 por consulta quando ativada. Tokens de pensamento são anunciados como tokens de saída. Controles de cache explícitos não são suportados.
Variantes
:variant1
| Campo | Valor |
|---|---|
| ID do modelo | qwen3-6-flash:variant1 |
| Data de lançamento do modelo | 2026-04-16 |
| Região | China |
| Janela de contexto | 1M |
| Precisão do peso | - |
| Tokens de saída máxima | 65,536 |
| Características | raciocínio, visão, vídeo, web_search, function_calling, structured_output, agentic_coding |
| Inferência nativa | Não |
| Endpoints suportados | POST /v1/chat/completions, POST /v1/responses, POST /v1/messages |
Preço
| Carga | Especificação | Taxa |
|---|---|---|
| Entrada | por 1M de tokens de prompt | <=256K $0.165 (era $0.25); 256K-1M $0.66 (era $1.00) |
| Produção | por 1M de tokens gerados | <=256K $0.99 (era $1.50); 256K-1M $3.961 (era $4.00) |
| Busca na web | por consulta quando ativada | $0.01 |
Parâmetros
| Parâmetro | Tipo | Obrigatório | Padrão | Descrição |
|---|---|---|---|---|
temperature | Número | Não | 0.7 | Temperatura de amostragem. 0 é determinístico e 2 é a aleatoriedade máxima. · Intervalo: 0 – 2 |
top_p | Número | Não | 0.9 | Amostragem do núcleo com a probabilidade de massa. Valores mais baixos tornam as saídas mais focadas. · Intervalo: 0 – 1 |
max_tokens | Número | Não | 4096 | Tokens de saída máximos. · Intervalo: 1 – 65536 |
stop | String | Não | - | Até 4 strings em que o modelo para de gerar mais tokens. |
enable_thinking | Booleano | Não | Verdade | Ative o raciocínio antes de responder. |
reasoning_effort | enum | Não | "medium" | Nível de esforço de raciocínio. Nenhum impede o pensamento. orçamentos limitados de pensamento de conjuntos baixos, médios, altos e máximos, dimensionados para o modelo selecionado. Enviado como um campo de reasoning_effort estilo OpenAI, traduzido em enable_thinking e thinking_budget para o serviço modelo. · Permitido: none, low, medium, high, max |
thinking_budget | Número | Não | 32768 | Tokens máximos reservados para raciocínio quando o pensamento está ativado. · Distribuição: 1 – 128000 |
response_format | Objeto | Não | - | Modo JSON compatível com OpenAI ou formato de resposta de esquema JSON. Use o modo não-pensar para esquemas estritos. |
vl_high_resolution_images | Booleano | Não | Verdade | Use processamento de resolução mais alta para entradas de imagem. |
max_pixels | Número | Não | 2621440 | Contagem máxima de pixels por imagem quando o processamento de alta resolução está desativado. · Intervalo: 4096 – 16777216 |
video_fps | Número | Não | 2 | Frames por segundo para amostrar a partir das entradas de vídeo. · Alcance: 0,1 – 10 |
tool_web_search | Booleano | Não | falso | Pesquise na internet por informações em tempo real. Adiciona $0.01 ao custo da solicitação quando ativado. |
Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/qwen3-6-flash.
