22. Le chain-of-thought est un outil de débogage, pas juste une astuce de performance

Le prompting chain-of-thought — demander au modèle de raisonner étape par étape avant de produire une réponse — améliore de façon fiable la performance sur les tâches complexes. C'est bien établi. Ce qui est moins discuté, c'est que la trace de reasoning qu'il produit est aussi l'un des artefacts de débogage les plus utiles dans ton système agentique.

Quand un agent produit une mauvaise réponse sans trace de reasoning, tu as un input, un output, et un vide dans lequel tu ne peux pas voir. Tu peux changer le prompt et voir si l'output change, mais tu travailles à l'aveugle. Quand un agent produit une mauvaise réponse avec une trace de reasoning, tu peux souvent voir exactement où ça a dérapé — l'étape où il a fait une hypothèse erronée, le point où il a mal lu le context, l'endroit où deux contraintes sont entrées en conflit et il les a résolues dans le mauvais sens. C'est de l'information exploitable.

Ça recadre la façon dont tu devrais penser au chain-of-thought dans les systèmes en production. Ce n'est pas juste une fonctionnalité de performance à activer pour les problèmes difficiles — c'est de l'infrastructure d'observability. La trace de reasoning est un log du processus de décision de l'agent. Comme tout bon log, elle est d'autant plus précieuse quand les choses tournent mal.

L'implication pratique, c'est de préserver les traces de reasoning même quand tu n'en as pas besoin pour la tâche elle-même. Route-les vers ton système de logging. Inclus-les dans les outputs de tes evals. Quand tu enquêtes sur un échec, commence par la trace. Tu trouveras souvent le problème plus vite qu'avec n'importe quel ajustement de prompt.

Une mise en garde mérite d'être gardée en tête : la trace de reasoning est un output, pas une fenêtre sur le calcul. Elle peut être cohérente et fausse. Une chaîne de reasoning qui a l'air plausible mais qui mène à une conclusion incorrecte reste un artefact de débogage utile — elle te dit que le modèle a construit un chemin crédible vers le mauvais endroit, ce qui restreint le type de changement de prompt qui pourrait aider. Mais ne fais pas l'erreur de prendre la trace pour une preuve de justesse.

Pense au chain-of-thought comme à une boîte noire d'avion. Tu espères ne jamais en avoir besoin. Tu es content qu'elle tournait quand tu en as besoin.