temperature | Número | Não | 0.7 | Temperatura de amostragem. 0 = determinística, 2 = aleatoriedade máxima. · Intervalo: 0 – 2 |
top_p | Número | Não | 0.9 | Amostragem do núcleo com a probabilidade de massa. Valores mais baixos tornam as saídas mais focadas. · Intervalo: 0 – 1 |
max_tokens | Número | Não | 4096 | Tokens de saída máximos. · Distribuição: 1 – 16000 |
stop | String | Não | - | Até 4 strings em que o modelo para de gerar mais tokens. |
enable_thinking | Booleano | Não | Verdade | Ative o raciocínio antes de responder. |
thinking_budget | Número | Não | 32768 | Tokens máximos reservados para raciocínio quando o pensamento está ativado. · Distribuição: 1 – 81920 |
reasoning_effort | enum | Não | "medium" | Nível de esforço de raciocínio. Nenhum impede o pensamento. orçamentos limitados de pensamento de conjuntos baixos, médios, altos e máximos, dimensionados para o modelo selecionado. Enviado como um campo de reasoning_effort estilo OpenAI, traduzido em enable_thinking e thinking_budget para o serviço modelo. · Permitido: none, low, medium, high, max |
web_search_linkup | Booleano | Não | falso | Busca opcional na web alimentada pelo Linkup. Quando ativadas, fontes web recentes são recuperadas usando sua última mensagem de usuário como consulta e fornecidas ao modelo como contexto adicional. Adiciona uma $0.013 fixa por requisição além do custo normal do token do modelo. Desativado por padrão. |
disable_formatting | Booleano | Não | falso | Quando ativado, o gateway não adiciona o rodapé “Fontes” às respostas assistentes que usaram busca web do Linkup. Útil quando a saída do modelo é canalizada para outro sistema que não espera decoração. |