Qu'est-ce que Tree-of-Thought ?
📍 In One Sentence
ToT demande au modèle : « Explorez 3 approches, évaluez-les, sélectionnez la meilleure ».
💬 In Plain Terms
C'est comme demander à quelqu'un de considérer 3 itinéraires différents, de peser les pros et les cons de chacun, puis de choisir le meilleur plutôt que simplement de suivre le premier itinéraire qui lui vient à l'esprit.
Tree-of-Thought demande au modèle d'explorer plusieurs chemins de raisonnement, d'évaluer chacun, puis de sélectionner le meilleur chemin avant de donner la réponse finale. Contrairement à Chain-of-Thought linéaire qui suit un seul chemin, ToT crée explicitement et compare des alternatives.
🔍 Pro Tip
Spécifiez toujours le nombre de branches (« Générez exactement 3 approches ») et les critères d'évaluation (« Comparez sur la faisabilité, le coût et le délai »). Sans critères explicites, le modèle a tendance à sélectionner la première branche qu'il génère.
Qu'est-ce que ReAct ?
📍 In One Sentence
ReAct alterne : Pensez → Agissez → Observez → Répétez.
💬 In Plain Terms
Vous formez une hypothèse, cherchez une information pour la tester, lisez le résultat, puis mis à jour votre hypothèse — c'est exactement ce que ReAct fait, modèle par modèle.
ReAct (Reason + Act) alterne les étapes de raisonnement avec les actions (appels d'outils, recherches, lookups) et observe les résultats. C'est le pattern fondamental derrière tous les agents IA modernes — du codage autonome à la recherche Web.
🔍 Did You Know
Chaque fois que Claude Code édite un fichier, exécute un test et corrige une erreur en fonction de la sortie, il exécute une boucle ReAct. Le pattern Thought-Action-Observation du papier 2023 est maintenant la colonne vertébrale des outils de codage IA autonomes utilisés par des millions de développeurs.
Différences clés
Chain-of-Thought (CoT) : Chemin unique et linéaire. Le modèle "pense étape par étape" sans explorer les alternatives.
Tree-of-Thought (ToT) : Ramification intentionnelle. Explore 2-5 branches, les évalue, sélectionne la meilleure. Beaucoup plus coûteux en tokens.
ReAct : Boucle linéaire avec interaction d'outils. Le modèle alterne entre le raisonnement et les appels d'outils (search, APIs, exécution de code).
Utilisez CoT pour les tâches d'explication et de logique simples. Utilisez ToT pour la stratégie et la planification où les alternatives importent. Utilisez ReAct pour la recherche et le débogage qui nécessitent des interactions externes.
Tableau de comparaison : CoT vs ToT vs ReAct
| Dimension | Chain-of-Thought (CoT) | Tree-of-Thought (ToT) | ReAct |
|---|---|---|---|
| Forme de raisonnement | Linéaire (chemin unique) | Ramification (plusieurs chemins → sélectionner le meilleur) | Linéaire avec boucles d'outils |
| Action centrale | "Penser étape par étape" | "Explorer 3 approches, évaluer, choisir" | "Reason → Act → Observe → Répéter" |
| Outils externes ? | Non | Non (uniquement interne) | Oui — recherche, APIs, exécution de code |
| Coût en tokens | ~1,5-2× | ~2-5× | Variable (dépend des appels d'outils) |
| Meilleur pour | Mathématiques, logique, explications | Stratégie, planification, idéation créative | Recherche, débogage, analyse de données |
| Support des modèles 2026 | Tous les modèles | Meilleur avec modèles de raisonnement (Opus 4.7, o3) | Intégré nativement dans tous les modèles frontière |
| Formatage manuel nécessaire ? | Oui (sur les modèles non-raisonnement) | Oui (le formatage explicite aide) | Non (utilisation native d'outils), sauf open-weights |
Comment rédiger un prompt Tree-of-Thought
Suivez ces étapes pour structurer un prompt ToT efficace :
- 1Énoncez le problème et spécifiez le nombre de branches : « Générez exactement 3 approches pour problème »
- 2Définissez les critères d'évaluation avant la sélection : « Comparez sur faisabilité / coût / risque / délai »
- 3Demandez au modèle d'évaluer chaque branche et de les classer ou d'attribuer des scores
- 4Ajoutez une instruction de sélection : « Sélectionnez l'approche qui équilibre le mieux critères »
- 5Complétez la tâche avec un raisonnement complet pour la branche sélectionnée
Comment rédiger un prompt ReAct
Utilisez ce template pour la boucle Reason-Act-Observe :
Pour les modèles frontière avec utilisation native d'outils, ce format est géré en interne. Le modèle décide quand appeler un outil, reçoit les résultats et continue le raisonnement — aucun formatage manuel nécessaire.
Pensée : Qu'est-ce qui doit se passer en premier ?
Action : [appel d'outil spécifique ou étape explicite]
Observation : [résultat de l'action]
Pensée : Qu'est-ce que cela me dit ?
Action : [étape suivante]
...
Réponse finale : [conclusion synthétisée]ReAct en 2026 : D'un pattern de prompting au comportement intégré
Le papier original ReAct (2023) proposait le format Thought/Action/Observation manuel comme pattern de prompting. En 2026, GPT-4o, Claude Opus 4.7/Sonnet 4.6 et Gemini 3.1 Pro implémentent la boucle ReAct automatiquement via Function Calling / outils natifs.
Le modèle décide quand appeler un outil, reçoit les résultats, continue le raisonnement — aucun formatage manuel requis. Vous définissez simplement les outils disponibles ; le modèle gère la boucle.
Quand le formatage manuel est encore pertinent :
1. Modèles open-weights sans utilisation native d'outils (Mistral, anciennes variantes LLaMA, Qwen)
2. Contextes éducatifs/débogage où vous souhaitez voir la trace complète
3. Interactions d'outils simulées où aucune API réelle n'est connectée
ReAct en production : Les outils de codage IA autonome (Claude Code, OpenAI Codex, Cursor) sont des boucles ReAct productionisées à grande échelle, où « actions » = éditions de fichiers et exécutions de tests.
⚠️ Warning
Les prompts Tree-of-Thought peuvent générer 3-5× les tokens de sortie d'un prompt standard. À €0,025/1M tokens de sortie (Claude Opus 4.7), un prompt ToT complexe qui génère 5 000 tokens coûte ~€0,125 par exécution. Budgétisez en conséquence.
Tree-of-Thought et ReAct dans les systèmes agentiques
Claude Code / OpenAI Codex : ReAct productionisée (reason → écrire du code → exécuter → observer les erreurs → corriger → itérer)
Agents de recherche (Perplexity, Deep Research) : formuler une question → rechercher → lire → synthétiser → rechercher à nouveau
Claude Managed Agents (2026) : ReAct entièrement gérée avec bac à sable sécurisé et outils intégrés
Planification agentique : Certains frameworks utilisent ToT au stade de la planification — proposer plusieurs approches, évaluer la faisabilité, exécuter la meilleure via ReAct
MCP (Model Context Protocol) : Standardise les connexions d'outils, rendant les boucles ReAct branché et joué
Exemples de prompts
❌ Vague
Aidez-moi à développer une stratégie marketing.
✅ Tree-of-Thought structuré
Générez exactement 3 stratégies marketing pour notre produit SaaS. Comparez chaque stratégie sur : coût, portée, délai de mise en œuvre, taux de conversion attendu. Évaluez chacune, attribuez des scores, puis sélectionnez la meilleure.
❌ Pas de structure
Recherchez les performances GPU RTX 5090.
✅ ReAct avec observation explicite
Pensée : Quelles sources comparent les GPU RTX 5090 ? Action : Cherchez les benchmarks GPU 2026 RTX 5090. Observation : [résultats]. Pensée : Quels sont les points clés ? Action : Extrayez la latence et la consommation électrique. Réponse finale : [synthèse]
❌ Pas itératif
Corrigez le code.
✅ ReAct itératif pour débogage
Pensée : Quel est l'erreur ? Action : Exécutez le code et montrez-moi la sortie. Observation : [erreur : KeyError à la ligne 42]. Pensée : La clé manque. Je dois ajouter une vérification d'existence de clé. Action : Mettez à jour le code. Observation : [pas d'erreur, sortie correcte]. Réponse finale : Code corrigé avec explication.
Coût en tokens
ToT : 2-5× les tokens de sortie de base car le modèle écrit plusieurs branches avant d'en sélectionner une.
ReAct : Variable selon le nombre d'appels d'outils (chaque rond action/observation ajoute des tokens).
Exemple de coût à €0,025/1M tokens de sortie (Claude Opus 4.7) : Un prompt ToT complexe qui génère 5 000 tokens = ~€0,125 par exécution.
Conseil pour les volumes élevés : Utilisez ToT judicieusement sur les décisions stratégiques ; préférez CoT linéaire pour les tâches de routine.
Comment démarrer
- 1Pour la stratégie/planification → utilisez ToT avec un nombre de branches explicite + critères d'évaluation
- 2Pour la recherche/débogage avec outils → utilisez ReAct (ou simplement l'utilisation native d'outils sur les modèles frontière)
- 3Combinez : ToT au stade de la planification, ReAct dans la branche choisie pour l'exécution
- 4Testez les deux patterns côte à côte dans PromptQuorum sur GPT-4o, Claude Opus 4.7, Gemini 3.1 Pro
Dans PromptQuorum
Testez les patterns ToT et ReAct côte à côte sur GPT-4o, Claude Opus 4.7/Sonnet 4.6, Gemini 3.1 Pro. Mesurez le coût en tokens, la qualité de sortie et la latence sans exposer les données à plusieurs APIs.
Lectures connexes
Questions fréquemment posées
Qu'est-ce que Tree-of-Thought prompting ?
Tree-of-Thought demande au modèle d'explorer plusieurs chemins de raisonnement — comme les branches d'un arbre de décision — d'évaluer chacun et de sélectionner le meilleur chemin avant de donner une réponse finale. Contrairement à CoT linéaire, ToT génère et compare explicitement les alternatives.
Qu'est-ce que ReAct prompting ?
ReAct (Reason + Act) est un framework de prompting où le modèle alterne entre les étapes de raisonnement et les actions (appels d'outils, recherches, lookups). Après chaque action, le modèle observe le résultat et met à jour son raisonnement. Ce pattern est la base des agents IA modernes.
En quoi Tree-of-Thought diffère-t-il de Chain-of-Thought ?
Chain-of-Thought suit un seul chemin de raisonnement linéaire. Tree-of-Thought se divise en plusieurs chemins, les évalue et sélectionne le meilleur. Pensez à CoT comme marcher sur une seule route vs ToT comme explorer une bifurcation avant de décider du chemin à prendre.
Dois-je encore formater ReAct manuellement en 2026 ?
Sur les modèles frontière avec utilisation native d'outils (GPT-4o, Claude Opus 4.7, Gemini 3.1 Pro), non. Ces modèles implémentent la boucle Reason-Act-Observe automatiquement via les APIs Function Calling. Le formatage manuel « Thought: / Action: / Observation: » est encore utile pour les modèles open-weights sans utilisation d'outils, pour la pédagogie ou pour les scénarios simulés.
Puis-je combiner Tree-of-Thought et ReAct ?
Oui. Utilisez ToT au niveau stratégique pour explorer et comparer plusieurs approches haut niveau, puis utilisez ReAct dans la branche sélectionnée pour exécuter les étapes qui nécessitent des interactions d'outils ou des recherches de données. C'est courant dans les tâches de planification complexe.
Quels modèles gèrent le mieux Tree-of-Thought ?
Les modèles avec modes Extended Thinking / Reasoning gèrent ToT de manière plus naturelle : Claude Opus 4.7 (extended thinking), GPT-4o (reasoning mode) et Gemini 3.1 Pro (Deep Think). Ces modèles peuvent explorer en interne plusieurs branches sans formatage explicite au niveau du prompting — bien que ToT explicite aide toujours.
Quelles sont les applications pratiques de ReAct ?
Chaque agent IA moderne est une boucle ReAct : Claude Code (raisonnez sur le code → éditez → exécutez les tests → observez → itérez), assistants de recherche (raisonnez sur la question → recherchez → lisez → synthétisez), bots d'assistance client (raisonnez sur la demande → consultez la base de connaissances → concevez la réponse → vérifiez). Le pattern s'étend des simples recherches aux sessions autonomes de plusieurs heures.
Comment Tree-of-Thought affecte-t-il le coût en tokens ?
ToT utilise nettement plus de tokens que CoT linéaire car le modèle génère plusieurs branches avant d'en sélectionner une. Comptez 2-5× les tokens de sortie d'un prompt CoT standard. À €0,025/1M tokens de sortie (Claude Opus 4.7), un prompt ToT complexe générant 5 000 tokens coûte ~€0,125 par exécution. Budgétisez en conséquence pour l'utilisation en volume.
Quelle est la pertinence de ToT et ReAct pour les données sensibles ?
La CNIL recommande l'utilisation d'IA locale lorsque vous traitez des données sensibles (financières, médicales, juridiques). Tree-of-Thought et ReAct sur des modèles auto-hébergés satisfont pleinement à ces exigences de confidentialité des données.
Puis-je utiliser Tree-of-Thought et ReAct en production ?
Oui. ReAct est le pattern fondamental des agents IA en production (Claude Code, OpenAI Codex). Tree-of-Thought est utilisé pour les décisions stratégiques complexes où les alternatives importent. Budget pour le coût en tokens supplémentaire et testez le comportement du modèle sur votre cas d'usage.
Sources
- Yao, S., Yu, D., Zhao, J., et al. (2023). "Tree of Thoughts: Deliberate Problem Solving with Large Language Models." NeurIPS 2023. arXiv:2305.10601
- Yao, S., Zhao, J., Yu, D., et al. (2023). "ReAct: Synergizing Reasoning and Acting in Language Models." ICLR 2023. arXiv:2210.03629
- Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." NeurIPS 2022. arXiv:2201.11903
- Shinn, N., Cassirer, A., Goyal, A., et al. (2023). "Reflexion: Language Agents with Verbal Reinforcement Learning." arXiv:2303.11366
- Anthropic. (2026). "Tool Use — Claude API Documentation." Retrieved from https://docs.anthropic.com
- OpenAI. (2026). "Function Calling — Responses API." Retrieved from https://platform.openai.com/docs