Qwen3.5 Omni Flash

POST /v1/chat/completionsModelo omnimodal econômico para lidar com texto, imagem, áudio e vídeo, com até 3 horas de áudio e 1 hora de vídeo em 90+ idiomas.
De um olhar
Precificação
Exemplo de pedido
Parâmetros
Notas
Faturamento de áudio
- O áudio é cobrado com uma taxa de token maior que text/image/vídeo
- Quando a saída de áudio está ativada, o texto de saída NÃO é carregado - apenas tokens de áudio
Voz e linguagem
- 55 timbres de voz disponíveis
- A saída de áudio suporta 29 idiomas, 7 dialetos
Faturamento por ferramenta (usage.tool_usage)
Quando esse modelo invoca ferramentas (busca web, interpretador de código, etc.) dentro de uma única requisição, a resposta carrega um mapa de usage.tool_usage normalizado junto com as contagens de tokens. O exemplo abaixo mostra a forma - nomes exatos de campos, unidades e quais ferramentas aparecem podem variar ligeiramente de acordo com o provedor:
A contagem de ferramentas já está em conta cost_usd - elas são apresentadas para transparência, permitindo auditar o faturamento por ferramenta. O campo é omitido quando nenhuma ferramenta foi invocada.
Machine esquema legível: GET https://api.empiriolabs.ai/v1/models/qwen3-5-omni-flash.
