temperature | Nombre | non | 0.7 | Température d’échantillonnage. 0 = déterministe, 2 = aléatoire maximal. · Plage: 0 – 2 |
top_p | Nombre | non | 0.9 | Probabilité d’échantillonnage du noyau, masse. Des valeurs plus basses rendent les sorties plus ciblées. · Répartition: 0 – 1 |
max_tokens | Nombre | non | 4096 | Jetons de sortie maximum. · Répartition: 1 – 16000 |
stop | Corde | non | - | Jusqu’à 4 chaînes où le modèle cesse de générer d’autres jetons. |
enable_thinking | Booléen | non | Vrai | Activez le raisonnement avant de répondre. |
thinking_budget | Nombre | non | 32768 | Le maximum de jetons est réservé pour le raisonnement lorsque la pensée est activée. · Répartition: 1 – 81920 |
reasoning_effort | enum | non | "medium" | Niveau d’effort de raisonnement. Aucun ne décourage la pensée. budgets de pensée limités faible, moyen, élevé et maximal adaptés au modèle sélectionné. Envoyé sous forme de champ reasoning_effort de type OpenAI, traduit en enable_thinking et thinking_budget pour le service modèle. · Autorisé: none, low, medium, high, max |
web_search_linkup | Booléen | non | faux | Recherche web optionnelle propulsée par Linkup. Lorsqu’activées, les sources web récentes sont récupérées en utilisant votre dernier message utilisateur comme requête et fournies au modèle comme contexte supplémentaire. Ajoute un $0.013 fixe par requête en plus du coût normal du jeton du modèle. Désactivé par défaut. |
disable_formatting | Booléen | non | faux | Une fois activée, la passerelle n’ajoutera pas le pied de page « Sources » aux réponses des assistants ayant utilisé la recherche web Linkup. Utile lorsque la sortie du modèle est canalisée vers un autre système qui n’attend aucune décoration. |