max_tokens | inteiro | Não | 4096 | Número máximo de tokens de saída a serem gerados. · Distribuição: 1 – 128000 |
temperature | Número | Não | 1 | Controla a aleatoriedade. Valores mais baixos tornam as respostas mais determinísticas. · Intervalo: 0 – 2 |
top_p | Número | Não | 0.95 | Corte de amostragem do núcleo. · Intervalo: 0 – 1 |
top_k | inteiro | Não | 20 | Limita a amostragem aos K tokens principais. · Intervalo: 1 – 100 |
repetition_penalty | Número | Não | 1 | Penaliza tokens repetidos. · Intervalo: 0,1 – 2 |
reasoning_effort | enum | Não | "medium" | Nível de esforço de raciocínio. Nenhum impede o pensamento. orçamentos limitados de pensamento de conjuntos baixos, médios, altos e máximos, dimensionados para o modelo selecionado. Enviado como um campo de reasoning_effort estilo OpenAI, traduzido em enable_thinking e thinking_budget para o serviço modelo. · Permitido: none, low, medium, high, max |
enable_thinking | Booleano | Não | Verdade | Permita que o modelo raciocine antes de responder. Desative isso para saída estruturada estritamente. |
thinking_budget | inteiro | Não | 32768 | Tokens máximos disponíveis para conteúdo de raciocínio quando o pensamento está ativado. · Intervalo: 1 – 38912 |
tool_stream | Booleano | Não | falso | Transmita argumentos de chamada de função de forma incremental ao transmitir. |
tools | Arranjo | Não | [] | Definições de ferramentas de chamada de função compatíveis com OpenAI. |
tool_choice | Objeto | Não | - | Controle de escolha de ferramentas compatível com OpenAI. |
parallel_tool_calls | Booleano | Não | Verdade | Permita múltiplas chamadas de ferramenta em um único turno de assistente quando suportado. |
response_format | Objeto | Não | - | Modo JSON compatível com OpenAI ou formato de resposta de esquema JSON. Use o modo não-pensar para esquemas estritos. |
stop | Arranjo | Não | - | Sequências opcionais de paradas. |
web_search_linkup | Booleano | Não | falso | Busca opcional na web alimentada pelo Linkup. Quando ativadas, fontes web recentes são recuperadas usando sua última mensagem de usuário como consulta e fornecidas ao modelo como contexto adicional. Adiciona uma $0.013 fixa por requisição além do custo normal do token do modelo. Desativado por padrão. |
disable_formatting | Booleano | Não | falso | Quando ativado, o gateway não adiciona o rodapé “Fontes” às respostas assistentes que usaram busca web do Linkup. Útil quando a saída do modelo é canalizada para outro sistema que não espera decoração. |