Les grands modèles de langage produisent confidentement des informations fausses. Ces erreurs, appelées hallucinations, vont de citations inventées à des faits fabriqués présentés avec une autorité complète. Comprendre pourquoi elles se produisent, comment les détecter et les réduire est essentiel pour utiliser les LLM dans un travail réel.

Que sont les hallucinations IA?

Une hallucination IA est une déclaration factuellement fausse ou fabriquée générée par un LLM avec une confiance apparente. Le modèle produit du texte qui viole la réalité – des noms erronés, des sources inventées, des dates impossibles, des URL fictives – en utilisant le même langage fluide que pour les informations exactes.

Cela diffère fondamentalement d'un modèle exprimant l'incertitude. Les hallucinations se caractérisent par des affirmations confiantes et détaillées sur des choses qui n'existent pas ou sur des événements qui ne se sont jamais produits. Un modèle pourrait citer un article publié dans une revue qui n'existe pas, inventer des détails biographiques, énoncer une date historique décalée de siècles, ou décrire une fonctionnalité de produit jamais construite. L'utilisateur le lit, suppose que le langage clair signale l'exactitude, et agit dessus – pour découvrir que l'information est fabriquée.

En une phrase: Les hallucinations sont des déclarations fausses formulées couramment que les modèles de langage génèrent parce qu'ils prédisent les modèles de texte plutôt que de récupérer les faits d'une source fiable.

Pourquoi les modèles de langage hallucinent

Les LLM fonctionnent en prédisant le mot suivant dans une séquence. Ils ne consultent pas une base de données et ne vérifient pas les faits par rapport à la vérité fondamentale. Ils calculent les probabilités en fonction des modèles dans les données d'entraînement. Cette conception fondamentale – très efficace pour les tâches de langage – crée intrinsèquement une pression pour halluciner.

Les mécanismes fondamentaux

Prédiction du token, pas récupération des faits. L'architecture du modèle est optimisée pour la génération de langage, pas la vérification des faits. Lorsqu'un prompt pose une question, l'objectif du modèle est de produire une continuation de texte cohérente et plausible. La cohérence et la véracité ne sont pas la même chose. Une fausse déclaration peut être beaucoup plus cohérente qu'un aveu d'incertitude.
Lacunes dans les données d'entraînement et expiration. Les modèles s'entraînent sur des données avec une date de fin spécifique. Les lacunes informatives – des sujets que le modèle n'a jamais rencontrés lors de l'entraînement, les événements récents après la date limite d'entraînement, les connaissances spécialisées dans des domaines étroits – créent des vides. Lorsqu'on le demande sur ces lacunes, le modèle manque de modèles véridiques pour prédire. Il invente des détails plausibles plutôt que de dire "je n'ai pas cette information."
Pas de mécanisme de confiance explicite. Les modèles ne génèrent pas un score de confiance aux côtés de chaque sortie. Ils produisent du texte sans un signal interne disant *"Je suis 30% sûr de cette affirmation."* La pression de remplir la page avec une sortie annule l'option de signaler le doute ou de refuser la demande.
Pression des prompts exigeant une réponse. Les prompts comme "Explique tout sur sujet" ou "Énumère toutes les raisons affirmation" communiquent implicitement: *tu dois répondre, même si tu n'es pas sûr*. Le modèle répond en inventant des détails pour satisfaire la demande. Il traite la pression d'être utile comme plus importante que le risque d'être inexact.
Fenêtre de contexte limitée et perte d'information. Les LLM ne peuvent tenir qu'une quantité finie de contexte en mémoire. Les longs documents ou les conversations font que les détails antérieurs s'estompent. Le modèle pourrait oublier ce qui a été dit dans une section antérieure, l'inventer ou le mal mémoriser, et affirmer confidentement la fabrication comme si elle était cohérente avec le contexte antérieur. Consultez notre guide sur les fenêtres de contexte pour comprendre pourquoi cela se produit et comment les limites de tokens affectent la fiabilité de la sortie.
Confabulation dans le raisonnement multi-étapes. Pour les problèmes nécessitant plusieurs étapes de raisonnement, le modèle peut perdre la trace des résultats intermédiaires. Il pourrait inventer une étape de soutien pour justifier une conclusion, ou sauter une étape et sauter à une fausse conclusion tout en générant du texte qui semble logiquement correct. Comprendre comment les tokens et les coûts s'adaptent aux longues chaînes de raisonnement vous aide à équilibrer la précision avec l'efficacité.

Types courants d'hallucinations

Les hallucinations viennent en motifs reconnaissables. Identifier le type vous aide à cibler les stratégies d'atténuation.

Type	Example	Why It Happens	Severity
Sources inventées	Citation d'un article évalué par les pairs qui n'existe pas; faux noms d'auteurs et années de publication	Le modèle a été entraîné sur des millions de citations et a appris des modèles de type citation, puis en invente de nouveaux	Très élevée
Mauvais faits (dates, nombres, noms)	Énoncer un événement historique en mauvaise année; détails biographiques incorrects	Les données d'entraînement sont incomplètes ou contradictoires; le modèle choisit un nombre plausible	Très élevée
URL et e-mails fabriqués	Fournir un lien ou une adresse e-mail qui ne se résout pas ou n'appartient pas à l'organisation revendiquée	Le modèle appris les modèles d'URL et d'e-mail et génère de nouveaux qui semblent réalistes mais sont fictifs	Élevée
Perte de contexte	Répondre à une question comme si le modèle avait compris le contexte antérieur, alors qu'il a en réalité perdu de vue	La fenêtre de contexte est finie; les longs documents font que les détails antérieurs s'estompent de l'attention du modèle	Élevée
Dérive de rôle	Commencer dans un rôle (analyste) et graduel passer à un autre (conteur), inventer des détails pour combler les lacunes	Le modèle perd de vue les instructions initiales et revient à la correspondance de motifs uniquement sur le texte	Moyen
Généralisation trop confiante	Déclarer "Tous les X font Y" alors que seuls les exemples d'entraînement spécifiques le montrent	Le modèle généralise trop largement à partir de données d'entraînement limitées sans vérification de confiance	Moyen
Contradiction interne	Énoncer les faits opposés au sein de la même réponse	Le modèle n'a pas de mécanisme pour suivre la cohérence sur plusieurs phrases	Moyen

Les sept types d'hallucinations sont: sources inventées, faux faits, URL et e-mails fabriqués, perte de contexte, dérive de rôle, généralisation trop confiante et contradictions internes.

Comment la conception des prompts affecte le risque d'hallucination

Vos prompts encouragent ou découragent les hallucinations. La différence est mesurable.

Prompts augmentant le risque d'hallucination:

"Dis-moi tout sur sujet" – aucune limite, aucune permission de dire "je ne sais pas"
"Assure-toi d'inclure de nombreux détails" – pression explicite pour remplir l'espace d'informations inventées
"Écris comme si tu étais un expert de premier plan" – encourage les affirmations confiantes, même pour les réclamations incertaines
"Réponds même si tu n'es pas complètement sûr" – supprime le frein sur l'hallucination

Prompts réduisant le risque d'hallucination:

"Tu peux dire 'Je ne sais pas' si tu n'es pas sûr" – permission explicite d'admettre les lacunes de connaissances
"Utilise uniquement les informations du contexte ci-dessous" – limite la réponse aux données fournies, pas aux connaissances inventées
"Sépare les faits des opinions. Marque les affirmations incertaines INCERTAIN" – force le modèle à différencier
"Cite ta source pour tout énoncé factuel" – rend les citations inventées manifestement visibles
"Si tu ne peux pas vérifier cette affirmation, ne l'inclus pas" – limite explicite sur les affirmations non vérifiées

Bonne structure de prompt

Les bons prompts combinent quatre éléments: un rôle ou contexte clair (quel cadre le modèle devrait-il adopter?), une tâche spécifique (quelle sortie ai-je besoin?), des données d'entrée réelles (quelles informations sont fournies?) et des contraintes explicites (que le modèle NE doit PAS faire?). Cette structure réduit la pression d'halluciner en supprimant l'ambiguïté sur ce que le modèle est supposé faire. Notre guide sur les 5 blocs de construction dont chaque prompt a besoin couvre chaque élément avec des exemples. Voir la définition complète des fondamentaux du prompt engineering pour une exploration plus profonde de la façon dont la structure affecte la fiabilité de la sortie.

Techniques pour réduire les hallucinations

Trois approches complémentaires réduisent les hallucinations: - Au niveau du prompt: Ajoutez des contraintes et permission d'admettre l'incertitude dans vos prompts - Au niveau du système: Utilisez RAG, l'appel de fonction ou la récupération pour ancrer les réponses dans les données réelles - Au niveau du modèle: Exécutez le même prompt sur plusieurs modèles indépendants pour détecter les hallucinations par consensus

1. Permission explicite de dire "Je ne sais pas"

Dites au modèle: "Si tu n'es pas sûr ou si tu n'as pas l'information, dis-le. Ne devine pas." Cela supprime la pression d'inventer des réponses. Beaucoup de modèles sont entraînés pour être utiles et tenteront de répondre même s'ils sont complètement incertains. Leur donner explicitement la permission de cette attente leur donne la permission de refuser.

2. Demander des sources ou des preuves

Demande: "Cite la source pour toute affirmation factuelle" ou "Fournir l'URL et la date de publication pour chaque référence." Cela rend les citations inventées évidentes (elles ne seront pas résolues ou pointeront vers des sources inexistantes) et force le modèle à être plus prudent sur l'affirmation de faits. Cela vous donne aussi un moyen de vérifier la sortie: cliquez sur chaque lien, vérifiez chaque source.

3. Autocritique et vérification des contradictions

Demande au modèle d'examiner sa propre sortie: > "Après avoir fini ta réponse, examen pour les contradictions ou les affirmations qui contredisent quelque chose que tu as dit plus tôt. Souligne toutes les incohérences que tu trouves." Les modèles attrapent souvent leurs propres erreurs lorsqu'on leur demande de réfléchir. Le modèle peut ensuite réviser la réponse avant que tu la voies.

4. Utiliser les instructions négatives

Préciser explicitement ce que le modèle ne doit PAS faire:

"N'invente jamais de sources, URL ou noms d'auteurs sous aucune circonstance"
"Ne devine pas les dates si tu n'es pas sûr – laisse la date vide plutôt que de deviner"
"N'ajoute pas d'informations qui ne sont pas dans le contexte fourni"

La formulation négative fonctionne parfois mieux que la formulation positive pour prévenir les erreurs spécifiques.

5. Raisonnement étape par étape avec vérification

Pour les tâches complexes, demande: > "Travaille cela étape par étape. Après chaque étape, vérifiez que l'étape précédente est correcte avant de passer à l'étape suivante." Décomposer la tâche en petites parties avec des étapes de vérification donne au modèle des chances de attraper les incohérences avant qu'elles ne s'aggravent.

6. Format de sortie structuré avec section de preuves

Demandez au modèle de séparer réponse, raisonnement et preuves en sections distinctes: ``` RÉPONSE: Réponse directe RAISONNEMENT: Comment tu as trouvé cette réponse PREUVES: Sources, faits ou citations supportant cela CONFIANCE: Combien tu es sûr, et pourquoi? ``` Cette structure rend les hallucinations faciles à repérer: les affirmations non supportées auront des sections PREUVES vides ou vagues, et des valeurs de CONFIANCE basses.

Stratégies au niveau système au-delà de la conception des prompts

Les prompts seuls ne suffisent pas pour les travaux critiques. Ajoutez ces outils et workflows.

Retrieval-Augmented Generation (RAG). Donnez au modèle un document spécifique, une base de connaissances ou un dataset et demandez-lui de répondre en utilisant uniquement ce contenu. Cela ancre les réponses dans les données réelles au lieu des données d'entraînement du modèle et élimine les hallucinations sur les informations manquantes. Des outils comme LangChain, la mise en cache de prompts d'Anthropic et les bases de données vectorielles implémentent ce modèle. Voir notre guide complet sur RAG: comment ancrer les réponses IA dans les données réelles.
Appel de fonction et utilisation de fonctions. Laissez le modèle appeler des fonctions externes pour les calculs, les recherches en base de données ou la vérification des faits. Au lieu d'inventer une statistique, le modèle appelle une fonction pour la récupérer. Cela supprime entièrement la tentation d'halluciner pour des domaines spécifiques.
Examen humain et vérification par les experts. Pour les décisions critiques – médicales, juridiques, financières, critiques pour la sécurité – laissez toujours un humain (de préférence un expert) vérifier les réponses générées par l'IA. Aucune technique de prompt ne remplace le jugement d'un expert.
Workflows de vérification automatisée des faits. Exécutez les résultats du modèle par des systèmes automatisés (API de vérification des faits, validation d'URL, vérification des citations) avant de les montrer aux utilisateurs. Cela détecte les hallucinations à l'échelle sans examen manuel de chaque sortie.

Plusieurs modèles et détection du consensus

Un seul modèle peut halluciner confidentement. Mais lorsque tu poses à plusieurs modèles indépendants la même question, ils désaccordent souvent sur les affirmations hallucées. Si cinq modèles produisent indépendamment des réponses similaires à une question, cette réponse est beaucoup plus susceptible d'être correcte que si un seul modèle répond. Si un seul modèle revendique quelque chose et quatre autres ne le mentionnent pas, cette réclamation est hautement suspecte et justifie une vérification. C'est le principe derrière consensus scoring: envoyez le même prompt à de nombreux modèles (GPT-4o, Claude Opus 4.7, Gemini 1.5 Pro, Mistral Large, Llama 3, DeepSeek, etc.) et analysez où ils s'accordent et où ils ne le font pas.

Test de consensus PromptQuorum

Testé dans PromptQuorum – 15 prompts sujets aux hallucinations envoyés à GPT-4o, Claude Opus 4.7 et Gemini 1.5 Pro: GPT-4o a complètement inventé 1 citation; Claude Opus 4.7 a refusé de citer des articles non vérifiés; Gemini 1.5 Pro a cité 3 articles réels mais 1 avec une année incorrecte. Seulement 1 citation apparaît dans les trois réponses du modèle. Ce test démontre que le consensus entre les modèles est un signal significatif de fiabilité – et que les réponses de modèle unique sont plus susceptibles de contenir des inventions. PromptQuorum automatise cela: envoyez un prompt à 25+ modèles IA simultanément, exécutez l'analyse de consensus sur toutes les réponses, et obtenez un jugement sur les affirmations ayant un accord élevé (probablement fiable) et lesquels ont un accord faible (digne d'être enquêté). L'outil signale exactement quelles affirmations se contredisent, identifie les affirmations qui n'apparaissent que dans une ou deux réponses, et ponde les réponses du modèle par la capacité – transformant la détection d'hallucination de suppositions dans l'analyse structurée basée sur les données. Voir comment l'IA multi-modèles réduit les hallucinations pour une explication technique plus profonde.

Perspectives mondiales sur la gouvernance des hallucinations

Le risque d'hallucination et les stratégies d'atténuation varient selon la région et le contexte réglementaire. En Europe, la loi sur l'IA de l'UE insiste sur la transparence et la déclaration des erreurs pour les systèmes d'IA à haut risque, rendant la documentation des hallucinations obligatoire. Mistral AI (France) a construit des modèles ayant un objectif spécifique pour réduire les hallucinations dans les applications conformes à l'UE. En Chine, des modèles comme Qwen 2.5 et DeepSeek ont des modèles d'hallucinations différents en raison de la composition des données d'entraînement et de l'efficacité de la tokenisation pour les langues CJK (chinois, japonais, coréen) – ces modèles gèrent différemment les ratios token-information que les modèles optimisés pour l'anglais. Au Japon, les entreprises opérant selon les directives de gouvernance des données du METI (Ministère de l'Économie, du Commerce et de l'Industrie) déploient de plus en plus des modèles localement pour les tâches sujettes aux hallucinations afin d'assurer la résidence des données et la conformité. Indépendamment de la région, les techniques fondamentales (RAG, vérification du consensus, examen humain) restent universellement applicables. Choisissez et vérifiez les modèles en fonction de votre contexte réglementaire et de vos exigences linguistiques.

Quand les hallucinations sont les plus dangereuses

Les hallucinations risquent des dommages importants dans des domaines spécifiques. Soyez particulièrement prudent avec:

Décisions médicales et de santé – Les mauvais noms de médicaments, les dosages ou les mauvaises interprétations de symptômes peuvent faire du mal aux patients
Questions juridiques et de conformité – Les jurisprudences inventées, les exigences réglementaires ou les précédents peuvent entraîner des erreurs coûteuses ou des violations
Conseils financiers – Les fausses données de marché, les informations fiscales incorrectes ou les métriques de performance fabriquées induisent en erreur les décisions à haut risque
Systèmes critiques pour la sécurité – Les hallucinations dans l'examen du code, les décisions architecturales ou l'analyse de sécurité peuvent introduire des vulnérabilités ou des bugs
Attribution publique – Tout ce qui est publié sous votre nom ou votre marque doit être vérifié; les hallucinations endommagent la crédibilité

Principe critique: Même avec des prompts parfaits et une vérification du consensus, la vérification humaine reste essentielle pour les décisions à haut risque. Utilisez l'IA comme un économiseur de temps et un outil de première passe, pas comme un remplacement du jugement d'expert ou de la vérification des sources primaires. Apprenez comment les techniques d'autocritique peuvent réduire davantage les erreurs dans les tâches de raisonnement complexe.

Checklist pratique: avant d'envoyer un prompt critique

Utilisez cette checklist avant d'envoyer un prompt sur lequel tu compteras pour des décisions ou une sortie publique:

Le prompt permet-il explicitement "Je ne sais pas"? Ajoutez: "Tu peux dire 'Je ne sais pas' si tu n'es pas sûr."
Y a-t-il un contexte ou des données réels dans le prompt? Les prompts vagues invitent l'invention. Fournissez des documents spécifiques, des exemples ou des données d'entrée.
Les contraintes sont-elles explicites? Déclarez ce que le modèle ne doit PAS faire, en particulier: "N'invente pas de sources, d'URL ou de citations."
Le format de sortie est-il structuré? Séparez Réponse / Raisonnement / Preuves / Confiance. Cela rend les affirmations non supportées évidentes.
Demandez-vous des sources? Pour toute affirmation factuelle, demandez: "Cite la source pour ce fait."
La tâche est-elle spécifique, pas ouverte? "Énumère cinq stratégies marketing *pour un produit B2B SaaS ciblant les professionnels financiers*" est mieux que "Parle-moi du marketing."
Avez-vous demandé au modèle d'auto-vérifier? Ajoutez: "Examinez ta réponse pour les contradictions avant de la soumettre."
Pour les décisions à haut risque, vérifiez-vous entre? Envoyez le même prompt à plusieurs modèles et comparez les réponses.

Exemple de prompt avant/après

Mauvais prompt

Pourquoi cela échoue: Ouvert, pas de contraintes, pas de permission d'admettre l'incertitude. Le modèle inventera des dates, attribuera mal les avancées, énoncera confidentement des informations obsolètes et citeras potentiellement des articles qui n'existent pas.

Parle-moi de l'histoire de l'intelligence artificielle. Inclus les grandes avancées et les chercheurs importants.

Bon prompt

En utilisant uniquement la chronologie suivante, résume les grandes avancées de l'IA de 1950 à 1990: {DONNÉES DE CHRONOLOGIE INSÉRÉES} Formate ta réponse comme: AVANCÉE: {Nom} ANNÉE: {Année — uniquement si indiquée dans la chronologie} IMPORTANCE: {Ce qu'elle a permis} SOURCE: {Quel document de la chronologie mentionne ceci?} N'ajoute pas d'informations qui ne sont pas dans la chronologie. Si tu n'es pas sûr que quelque chose est dans la chronologie, saute-le plutôt que de deviner.

Pourquoi cela fonctionne:

Données réelles au lieu d'invention: Le modèle travaille à partir du contexte fourni, pas des lacunes dans les données d'entraînement
Sortie structurée: Le format rend les sources manquantes immédiatement évidentes
Instruction négative: "N'ajoute pas d'informations qui ne sont pas dans la chronologie" est explicite
Permission d'omettre: "Si tu n'es pas sûr, saute-le" supprime la pression d'inventer des détails
Responsabilité des sources: Chaque affirmation exige de citer quel document elle provient

Foire aux questions

Les hallucinations peuvent-elles être complètement éliminées?

Non. Les hallucinations sont inhérentes à la façon dont les modèles de langage fonctionnent – ils prédisent les modèles de texte plutôt que de récupérer les faits d'une source vérifiée. Vous pouvez les réduire considérablement avec une bonne conception de prompts, des outils comme RAG et le consensus multi-modèles, mais l'élimination complète n'est pas possible compte tenu de l'architecture LLM actuelle. La vérification humaine reste nécessaire pour les décisions à haut risque.

Pourquoi le modèle semble-t-il si confiant quand il se trompe?

Les modèles de langage sont entraînés pour générer du texte fluide et cohérent. La confiance est un sous-produit de la cohérence linguistique. Une fausse déclaration peut être beaucoup plus cohérente et bien articulée qu'un honnête aveu d'incertitude. Le modèle n'a pas de mécanisme intégré pour exprimer le doute – il produit du texte avec la même confiance fluide, indépendamment de l'exactitude.

Les modèles plus récents et plus grands hallucinent-ils moins?

Les plus grands modèles hallucinent souvent plus pour certaines tâches car ils sont meilleurs pour générer du texte plausible, ce qui rend les fausses affirmations plus difficiles à détecter. Cependant, les modèles plus récents obtiennent de meilleurs résultats sur certaines tâches factuelles (ils ont des données d'entraînement plus récentes et un suivi d'instruction plus fort). La relation entre la taille du modèle et l'hallucination dépend de la tâche, pas monotone.

Connecter un modèle à Internet supprime-t-il les hallucinations?

Partiellement. L'accès Web en temps réel aide avec les événements actuels et les faits récents, mais il ne résout pas le problème fondamental: le modèle invente toujours des détails, mal interprète les résultats de recherche ou hallucine sur le contenu qu'il n'a pas récupéré. L'accès Internet est un outil qui réduit une classe d'hallucinations, pas une cure.

Comment puis-je vérifier rapidement si une réponse est hallucée?

Vérifiez les sources: Cliquez sur les URL ou recherchez les articles cités. S'ils n'existent pas, la réponse est hallucée. Vérifiez les faits: Vérifiez les dates, les noms et les nombres contre les sources fiables. Comparez plusieurs modèles: Posez la même question à différents modèles. L'désaccord tranchant suggère qu'au moins un hallucine. Appliquez l'expertise du domaine: Si vous connaissez le domaine, lisez attentivement les plausibilités subtiles – les hallucinations ont souvent des signes révélateurs pour les lecteurs experts.

Dois-je cesser d'utiliser l'IA si elle hallucine?

Non. Utilisez l'IA stratégiquement avec vérification. Pour le brainstorming, la rédaction et l'exploration, les hallucinations sont une perte mineure. Pour le travail critique en fait (recherche, conformité, décisions médicales, conseils financiers), utilisez l'IA comme point de départ, puis vérifiez tout avec des sources fiables ou un examen expert.

Quelle est la différence entre une hallucination et une vraie erreur?

Une hallucination est confiante et fausse. Si un modèle dit "Je ne suis pas sûr, mais cela pourrait être X," c'est de l'incertitude honnête, pas une hallucination. S'il dit "La capitale de la France est Berlin" avec une confiance totale, c'est une hallucination – le modèle a dit quelque chose de faux comme si c'était un fait. Le hallmark est l'affirmation confiante de quelque chose d'inexact.

Lectures connexes

Qu'est-ce que le prompt engineering? – les concepts fondamentaux derrière la structuration des prompts
Consensus Scoring multi-modèles – comment comparer les modèles détecte les désaccords et l'instabilité
Techniques de prompt d'autocritique – comment obtenir des modèles pour attraper leurs propres erreurs

Sources

Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." ArXiv — l'article fondateur démontrant que le raisonnement étape par étape réduit les hallucinations sur les tâches mathématiques et logiques.
Maynez, J., Narayan, S., Hashimoto, B., & Hardt, D. (2021). "On Faithfulness and Factuality in Abstractive Summarization." ACL Proceedings — étude empirique des taux et des mécanismes d'hallucination dans la génération de texte neuronal.
Anthropic (2024). "Constitutional AI." https://www.anthropic.com/constitutional-ai — approche d'Anthropic pour réduire les résultats nuisibles et les hallucinations par l'entraînement basé sur les principes.

Hallucinations IA: Pourquoi l'IA Invente des Choses — et Comment les Arrêter

Résumé visuel: Hallucinations IA: Pourquoi l'IA Invente des Choses — et Comment les Arrêter