Tree-of-Thought et ReAct Prompting sont deux techniques de raisonnement avancées : Tree-of-Thought explore plusieurs chemins de solution possibles comme un arbre de décision, tandis que ReAct entrelace le raisonnement avec des actions explicites telles que la recherche ou la récupération d'informations.

Qu'est-ce que Tree-of-Thought ?

📍 In One Sentence

ToT demande au modèle : « Explorez 3 approches, évaluez-les, sélectionnez la meilleure ».

💬 In Plain Terms

C'est comme demander à quelqu'un de considérer 3 itinéraires différents, de peser les pros et les cons de chacun, puis de choisir le meilleur plutôt que simplement de suivre le premier itinéraire qui lui vient à l'esprit.

Tree-of-Thought demande au modèle d'explorer plusieurs chemins de raisonnement, d'évaluer chacun, puis de sélectionner le meilleur chemin avant de donner la réponse finale. Contrairement à Chain-of-Thought linéaire qui suit un seul chemin, ToT crée explicitement et compare des alternatives.

🔍 Pro Tip

Spécifiez toujours le nombre de branches (« Générez exactement 3 approches ») et les critères d'évaluation (« Comparez sur la faisabilité, le coût et le délai »). Sans critères explicites, le modèle a tendance à sélectionner la première branche qu'il génère.

Qu'est-ce que ReAct ?

📍 In One Sentence

ReAct alterne : Pensez → Agissez → Observez → Répétez.

💬 In Plain Terms

Vous formez une hypothèse, cherchez une information pour la tester, lisez le résultat, puis mis à jour votre hypothèse — c'est exactement ce que ReAct fait, modèle par modèle.

ReAct (Reason + Act) alterne les étapes de raisonnement avec les actions (appels d'outils, recherches, lookups) et observe les résultats. C'est le pattern fondamental derrière tous les agents IA modernes — du codage autonome à la recherche Web.

🔍 Did You Know

Chaque fois que Claude Code édite un fichier, exécute un test et corrige une erreur en fonction de la sortie, il exécute une boucle ReAct. Le pattern Thought-Action-Observation du papier 2023 est maintenant la colonne vertébrale des outils de codage IA autonomes utilisés par des millions de développeurs.

Différences clés

Chain-of-Thought (CoT) : Chemin unique et linéaire. Le modèle "pense étape par étape" sans explorer les alternatives.

Tree-of-Thought (ToT) : Ramification intentionnelle. Explore 2-5 branches, les évalue, sélectionne la meilleure. Beaucoup plus coûteux en tokens.

ReAct : Boucle linéaire avec interaction d'outils. Le modèle alterne entre le raisonnement et les appels d'outils (search, APIs, exécution de code).

Utilisez CoT pour les tâches d'explication et de logique simples. Utilisez ToT pour la stratégie et la planification où les alternatives importent. Utilisez ReAct pour la recherche et le débogage qui nécessitent des interactions externes.

Tableau de comparaison : CoT vs ToT vs ReAct

Dimension	Chain-of-Thought (CoT)	Tree-of-Thought (ToT)	ReAct
Forme de raisonnement	Linéaire (chemin unique)	Ramification (plusieurs chemins → sélectionner le meilleur)	Linéaire avec boucles d'outils
Action centrale	"Penser étape par étape"	"Explorer 3 approches, évaluer, choisir"	"Reason → Act → Observe → Répéter"
Outils externes ?	Non	Non (uniquement interne)	Oui — recherche, APIs, exécution de code
Coût en tokens	~1,5-2×	~2-5×	Variable (dépend des appels d'outils)
Meilleur pour	Mathématiques, logique, explications	Stratégie, planification, idéation créative	Recherche, débogage, analyse de données
Support des modèles 2026	Tous les modèles	Meilleur avec modèles de raisonnement (Opus 4.7, o3)	Intégré nativement dans tous les modèles frontière
Formatage manuel nécessaire ?	Oui (sur les modèles non-raisonnement)	Oui (le formatage explicite aide)	Non (utilisation native d'outils), sauf open-weights

Comment rédiger un prompt Tree-of-Thought

Suivez ces étapes pour structurer un prompt ToT efficace :

1
Énoncez le problème et spécifiez le nombre de branches : « Générez exactement 3 approches pour problème »
2
Définissez les critères d'évaluation avant la sélection : « Comparez sur faisabilité / coût / risque / délai »
3
Demandez au modèle d'évaluer chaque branche et de les classer ou d'attribuer des scores
4
Ajoutez une instruction de sélection : « Sélectionnez l'approche qui équilibre le mieux critères »
5
Complétez la tâche avec un raisonnement complet pour la branche sélectionnée

Comment rédiger un prompt ReAct

Utilisez ce template pour la boucle Reason-Act-Observe :

Pour les modèles frontière avec utilisation native d'outils, ce format est géré en interne. Le modèle décide quand appeler un outil, reçoit les résultats et continue le raisonnement — aucun formatage manuel nécessaire.

text

Pensée : Qu'est-ce qui doit se passer en premier ?
Action : [appel d'outil spécifique ou étape explicite]
Observation : [résultat de l'action]
Pensée : Qu'est-ce que cela me dit ?
Action : [étape suivante]
...
Réponse finale : [conclusion synthétisée]

ReAct en 2026 : D'un pattern de prompting au comportement intégré

Le papier original ReAct (2023) proposait le format Thought/Action/Observation manuel comme pattern de prompting. En 2026, GPT-4o, Claude Opus 4.7/Sonnet 4.6 et Gemini 3.1 Pro implémentent la boucle ReAct automatiquement via Function Calling / outils natifs.

Le modèle décide quand appeler un outil, reçoit les résultats, continue le raisonnement — aucun formatage manuel requis. Vous définissez simplement les outils disponibles ; le modèle gère la boucle.

Quand le formatage manuel est encore pertinent :

1. Modèles open-weights sans utilisation native d'outils (Mistral, anciennes variantes LLaMA, Qwen)

2. Contextes éducatifs/débogage où vous souhaitez voir la trace complète

3. Interactions d'outils simulées où aucune API réelle n'est connectée

ReAct en production : Les outils de codage IA autonome (Claude Code, OpenAI Codex, Cursor) sont des boucles ReAct productionisées à grande échelle, où « actions » = éditions de fichiers et exécutions de tests.

⚠️ Warning

Les prompts Tree-of-Thought peuvent générer 3-5× les tokens de sortie d'un prompt standard. À €0,025/1M tokens de sortie (Claude Opus 4.7), un prompt ToT complexe qui génère 5 000 tokens coûte ~€0,125 par exécution. Budgétisez en conséquence.

Tree-of-Thought et ReAct dans les systèmes agentiques

Claude Code / OpenAI Codex : ReAct productionisée (reason → écrire du code → exécuter → observer les erreurs → corriger → itérer)

Agents de recherche (Perplexity, Deep Research) : formuler une question → rechercher → lire → synthétiser → rechercher à nouveau

Claude Managed Agents (2026) : ReAct entièrement gérée avec bac à sable sécurisé et outils intégrés

Planification agentique : Certains frameworks utilisent ToT au stade de la planification — proposer plusieurs approches, évaluer la faisabilité, exécuter la meilleure via ReAct

MCP (Model Context Protocol) : Standardise les connexions d'outils, rendant les boucles ReAct branché et joué

Exemples de prompts

❌ Vague

Aidez-moi à développer une stratégie marketing.

✅ Tree-of-Thought structuré

Générez exactement 3 stratégies marketing pour notre produit SaaS. Comparez chaque stratégie sur : coût, portée, délai de mise en œuvre, taux de conversion attendu. Évaluez chacune, attribuez des scores, puis sélectionnez la meilleure.

❌ Pas de structure

Recherchez les performances GPU RTX 5090.

✅ ReAct avec observation explicite

Pensée : Quelles sources comparent les GPU RTX 5090 ? Action : Cherchez les benchmarks GPU 2026 RTX 5090. Observation : [résultats]. Pensée : Quels sont les points clés ? Action : Extrayez la latence et la consommation électrique. Réponse finale : [synthèse]

❌ Pas itératif

Corrigez le code.

✅ ReAct itératif pour débogage

Pensée : Quel est l'erreur ? Action : Exécutez le code et montrez-moi la sortie. Observation : [erreur : KeyError à la ligne 42]. Pensée : La clé manque. Je dois ajouter une vérification d'existence de clé. Action : Mettez à jour le code. Observation : [pas d'erreur, sortie correcte]. Réponse finale : Code corrigé avec explication.

Coût en tokens

ToT : 2-5× les tokens de sortie de base car le modèle écrit plusieurs branches avant d'en sélectionner une.

ReAct : Variable selon le nombre d'appels d'outils (chaque rond action/observation ajoute des tokens).

Exemple de coût à €0,025/1M tokens de sortie (Claude Opus 4.7) : Un prompt ToT complexe qui génère 5 000 tokens = ~€0,125 par exécution.

Conseil pour les volumes élevés : Utilisez ToT judicieusement sur les décisions stratégiques ; préférez CoT linéaire pour les tâches de routine.

Comment démarrer

1
Pour la stratégie/planification → utilisez ToT avec un nombre de branches explicite + critères d'évaluation
2
Pour la recherche/débogage avec outils → utilisez ReAct (ou simplement l'utilisation native d'outils sur les modèles frontière)
3
Combinez : ToT au stade de la planification, ReAct dans la branche choisie pour l'exécution
4
Testez les deux patterns côte à côte dans PromptQuorum sur GPT-4o, Claude Opus 4.7, Gemini 3.1 Pro

Dans PromptQuorum

Testez les patterns ToT et ReAct côte à côte sur GPT-4o, Claude Opus 4.7/Sonnet 4.6, Gemini 3.1 Pro. Mesurez le coût en tokens, la qualité de sortie et la latence sans exposer les données à plusieurs APIs.

Lectures connexes

Questions fréquemment posées

Qu'est-ce que Tree-of-Thought prompting ?

Tree-of-Thought demande au modèle d'explorer plusieurs chemins de raisonnement — comme les branches d'un arbre de décision — d'évaluer chacun et de sélectionner le meilleur chemin avant de donner une réponse finale. Contrairement à CoT linéaire, ToT génère et compare explicitement les alternatives.

Qu'est-ce que ReAct prompting ?

ReAct (Reason + Act) est un framework de prompting où le modèle alterne entre les étapes de raisonnement et les actions (appels d'outils, recherches, lookups). Après chaque action, le modèle observe le résultat et met à jour son raisonnement. Ce pattern est la base des agents IA modernes.

En quoi Tree-of-Thought diffère-t-il de Chain-of-Thought ?

Chain-of-Thought suit un seul chemin de raisonnement linéaire. Tree-of-Thought se divise en plusieurs chemins, les évalue et sélectionne le meilleur. Pensez à CoT comme marcher sur une seule route vs ToT comme explorer une bifurcation avant de décider du chemin à prendre.

Dois-je encore formater ReAct manuellement en 2026 ?

Sur les modèles frontière avec utilisation native d'outils (GPT-4o, Claude Opus 4.7, Gemini 3.1 Pro), non. Ces modèles implémentent la boucle Reason-Act-Observe automatiquement via les APIs Function Calling. Le formatage manuel « Thought: / Action: / Observation: » est encore utile pour les modèles open-weights sans utilisation d'outils, pour la pédagogie ou pour les scénarios simulés.

Puis-je combiner Tree-of-Thought et ReAct ?

Oui. Utilisez ToT au niveau stratégique pour explorer et comparer plusieurs approches haut niveau, puis utilisez ReAct dans la branche sélectionnée pour exécuter les étapes qui nécessitent des interactions d'outils ou des recherches de données. C'est courant dans les tâches de planification complexe.

Quels modèles gèrent le mieux Tree-of-Thought ?

Les modèles avec modes Extended Thinking / Reasoning gèrent ToT de manière plus naturelle : Claude Opus 4.7 (extended thinking), GPT-4o (reasoning mode) et Gemini 3.1 Pro (Deep Think). Ces modèles peuvent explorer en interne plusieurs branches sans formatage explicite au niveau du prompting — bien que ToT explicite aide toujours.

Quelles sont les applications pratiques de ReAct ?

Chaque agent IA moderne est une boucle ReAct : Claude Code (raisonnez sur le code → éditez → exécutez les tests → observez → itérez), assistants de recherche (raisonnez sur la question → recherchez → lisez → synthétisez), bots d'assistance client (raisonnez sur la demande → consultez la base de connaissances → concevez la réponse → vérifiez). Le pattern s'étend des simples recherches aux sessions autonomes de plusieurs heures.

Comment Tree-of-Thought affecte-t-il le coût en tokens ?

ToT utilise nettement plus de tokens que CoT linéaire car le modèle génère plusieurs branches avant d'en sélectionner une. Comptez 2-5× les tokens de sortie d'un prompt CoT standard. À €0,025/1M tokens de sortie (Claude Opus 4.7), un prompt ToT complexe générant 5 000 tokens coûte ~€0,125 par exécution. Budgétisez en conséquence pour l'utilisation en volume.

Quelle est la pertinence de ToT et ReAct pour les données sensibles ?

La CNIL recommande l'utilisation d'IA locale lorsque vous traitez des données sensibles (financières, médicales, juridiques). Tree-of-Thought et ReAct sur des modèles auto-hébergés satisfont pleinement à ces exigences de confidentialité des données.

Puis-je utiliser Tree-of-Thought et ReAct en production ?

Oui. ReAct est le pattern fondamental des agents IA en production (Claude Code, OpenAI Codex). Tree-of-Thought est utilisé pour les décisions stratégiques complexes où les alternatives importent. Budget pour le coût en tokens supplémentaire et testez le comportement du modèle sur votre cas d'usage.

Sources

Yao, S., Yu, D., Zhao, J., et al. (2023). "Tree of Thoughts: Deliberate Problem Solving with Large Language Models." NeurIPS 2023. arXiv:2305.10601
Yao, S., Zhao, J., Yu, D., et al. (2023). "ReAct: Synergizing Reasoning and Acting in Language Models." ICLR 2023. arXiv:2210.03629
Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." NeurIPS 2022. arXiv:2201.11903
Shinn, N., Cassirer, A., Goyal, A., et al. (2023). "Reflexion: Language Agents with Verbal Reinforcement Learning." arXiv:2303.11366
Anthropic. (2026). "Tool Use — Claude API Documentation." Retrieved from https://docs.anthropic.com
OpenAI. (2026). "Function Calling — Responses API." Retrieved from https://platform.openai.com/docs

Tree of Thought et ReAct : Techniques de raisonnement avancées pour les problèmes complexes