O que são alucinações de IA?
Uma alucinação de IA é uma declaração factualmente falsa ou fabricada gerada por um LLM com aparente confiança. O modelo produz texto que viola a realidade — nomes errados, fontes inventadas, datas impossíveis, URLs fictícias — usando a mesma linguagem fluente que a informação precisa.
Isso difere fundamentalmente de um modelo que expressa incerteza. As alucinações se caracterizam por afirmações confiantes e detalhadas sobre coisas que não existem ou eventos que não ocorreram. Um modelo pode citar um artigo publicado em uma revista que não existe, inventar detalhes biográficos, afirmar uma data histórica errada por séculos, ou descrever uma funcionalidade de produto que nunca foi construída. O usuário lê, assume que a linguagem clara sinaliza precisão, e age com base nisso — apenas para descobrir que a informação é fabricada.
Em uma sentença: Alucinações são declarações falsas e fluentes que os modelos de linguagem geram porque preveem padrões de texto em vez de recuperar fatos de um armazenamento confiável.
Por que os modelos de linguagem alucinam
Os LLMs funcionam prevendo a próxima palavra em uma sequência. Eles não consultam um banco de dados nem verificam fatos contra a verdade fundamental. Eles calculam probabilidades com base em padrões nos dados de treinamento. Esse design central — altamente eficaz para tarefas de linguagem — cria inerentemente pressão para alucinar.
Os mecanismos centrais
- Previsão do próximo token, não recuperação de fatos. A arquitetura do modelo é otimizada para geração de linguagem, não verificação de fatos. Quando um prompt faz uma pergunta, o objetivo do modelo é produzir uma continuação coerente e plausível do texto. Coerência e veracidade não são a mesma coisa. Uma afirmação falsa pode ser muito mais coerente do que uma admissão de incerteza.
- Lacunas e vencimento dos dados de treinamento. Os modelos são treinados em dados com uma data final específica. As lacunas de informação — tópicos que o modelo nunca encontrou durante o treinamento, eventos recentes após o corte de treinamento, conhecimento especializado em domínios restritos — criam vazios. Quando questionado sobre essas lacunas, o modelo carece de padrões verdadeiros para prever. Ele inventa detalhes plausíveis em vez de dizer "Não tenho essa informação."
- Sem mecanismo de confiança explícito. Os modelos não geram uma pontuação de confiança ao lado de cada saída. Eles produzem texto sem um sinal interno que diga *"Estou 30% certo sobre esta afirmação."* A pressão de preencher a página com saída supera a opção de sinalizar dúvida ou recusar a solicitação.
- Pressão de prompts que exigem respostas. Prompts como "Explique tudo sobre tópico" ou "Liste todas as razões afirmação" comunicam implicitamente: *você deve responder, mesmo que não tenha certeza*. O modelo responde inventando detalhes para satisfazer a solicitação. Ele trata a pressão de ser útil como mais importante do que o risco de ser impreciso.
- Janela de contexto limitada e perda de informação. Os LLMs só podem reter uma quantidade finita de contexto na memória. Documentos ou conversas longas fazem com que os detalhes anteriores desapareçam. O modelo pode esquecer o que foi dito em uma seção anterior, inventar ou lembrar incorretamente, e afirmar com confiança a fabricação como se fosse consistente com o contexto anterior. Consulte nosso guia sobre janelas de contexto para entender por que isso acontece e como os limites de tokens afetam a confiabilidade da saída.
- Confabulação no raciocínio de múltiplas etapas. Para problemas que requerem várias etapas de raciocínio, o modelo pode perder o controle dos resultados intermediários. Ele pode inventar uma etapa de suporte para justificar uma conclusão, ou pular uma etapa e chegar a uma conclusão falsa enquanto gera texto que parece logicamente correto. Entender como os tokens e os custos escalam com cadeias de raciocínio longas ajuda a equilibrar precisão versus eficiência.
Tipos comuns de alucinações
As alucinações seguem padrões reconhecíveis. Identificar o tipo ajuda a direcionar as estratégias de mitigação.
| Type | Example | Why It Happens | Severity |
|---|---|---|---|
| Fontes inventadas | Citação de um artigo revisado por pares que não existe; nomes de autores e anos de publicação falsos | O modelo foi treinado em milhões de citações e aprendeu padrões semelhantes a citações, depois inventa novas | Muito alta |
| Fatos errados (datas, números, nomes) | Afirmar um evento histórico no ano errado; detalhes biográficos incorretos | Os dados de treinamento são incompletos ou contraditórios; o modelo escolhe um número plausível | Muito alta |
| URLs e e-mails falsos | Fornecer um link ou endereço de e-mail que não funciona ou não pertence à organização mencionada | O modelo aprendeu padrões de URL e e-mail e gera novos que são realistas mas fictícios | Alta |
| Perda de contexto | Responder a uma pergunta como se o modelo tivesse entendido o contexto anterior, quando na verdade perdeu o controle | A janela de contexto é finita; documentos longos fazem com que os detalhes anteriores desapareçam da atenção do modelo | Alta |
| Deriva de função | Começar em uma função (analista) e gradualmente mudar para outra (narrador), inventando detalhes para preencher lacunas | O modelo perde o controle da instrução inicial e volta a fazer correspondência de padrões apenas no texto | Média |
| Generalização com excesso de confiança | Afirmar "Todos os X fazem Y" quando apenas os exemplos de treinamento específicos mostram isso | O modelo generaliza de forma excessiva a partir de dados de treinamento limitados sem verificação de confiança | Média |
| Contradição interna | Fazer afirmações contraditórias dentro da mesma resposta | O modelo não tem mecanismo para rastrear consistência em múltiplas frases | Média |
Os sete tipos de alucinações são: fontes inventadas, fatos errados, URLs e e-mails falsos, perda de contexto, deriva de função, generalização com excesso de confiança e contradições internas.
Como o design do prompt afeta o risco de alucinação
Seus prompts encorajam ou desencorajam as alucinações. A diferença é mensurável.
Prompts que aumentam o risco de alucinação:
- "Me conte tudo sobre tópico" — sem limites, sem permissão para dizer "não sei"
- "Certifique-se de incluir muitos detalhes" — pressão explícita para preencher o espaço com informações inventadas
- "Escreva como se fosse um especialista líder" — encoraja afirmações confiantes, mesmo para afirmações incertas
- "Responda mesmo que não esteja completamente certo" — remove o freio sobre a alucinação
Prompts que reduzem o risco de alucinação:
- "Você pode dizer 'Não sei' se não tiver certeza" — permissão explícita para admitir lacunas de conhecimento
- "Use apenas informações do contexto abaixo" — restringe a resposta aos dados fornecidos, não ao conhecimento inventado
- "Separe fatos de opiniões. Marque afirmações incertas INCERTO" — força o modelo a diferenciar
- "Cite sua fonte para qualquer afirmação factual" — torna as citações inventadas obviamente visíveis
- "Se você não puder verificar essa afirmação, não a inclua" — restrição explícita sobre afirmações não verificadas
Boa estrutura de prompt
Bons prompts combinam quatro elementos: um papel ou contexto claro (que enquadramento o modelo deve adotar?), uma tarefa específica (que saída eu preciso?), dados de entrada reais (que informações são fornecidas?) e restrições explícitas (o que o modelo NÃO deve fazer?). Essa estrutura reduz a pressão para alucinar ao eliminar a ambiguidade sobre o que o modelo deve fazer. Nosso guia sobre os 5 blocos de construção que todo prompt precisa cobre cada elemento com exemplos.
Veja a definição completa dos fundamentos do prompt engineering para uma exploração mais profunda de como a estrutura afeta a confiabilidade da saída.
Técnicas para reduzir alucinações
Três abordagens complementares reduzem as alucinações: - Em nível de prompt: Adicione restrições e permissão para admitir incerteza em seus prompts - Em nível de sistema: Use RAG, chamada de função ou recuperação para fundamentar as respostas em dados reais - Em nível de modelo: Execute o mesmo prompt em vários modelos independentes para detectar alucinações por consenso
1. Permissão explícita para dizer "Não sei"
Diga ao modelo: "Se você não tiver certeza ou não tiver a informação, diga isso. Não adivinhe."
Isso remove a pressão de inventar respostas. Muitos modelos são treinados para ser úteis e tentarão responder mesmo quando estiverem completamente incertos. Dar-lhes explicitamente permissão para se libertar dessa expectativa lhes dá permissão para recusar.
2. Solicitar fontes ou evidências
Solicite: "Cite a fonte para qualquer afirmação factual" ou "Forneça a URL e a data de publicação para cada referência."
Isso torna as citações inventadas óbvias (elas não serão resolvidas ou apontarão para fontes inexistentes) e força o modelo a ser mais cuidadoso ao afirmar fatos. Também dá uma forma de verificar a saída: clique em cada link, verifique cada fonte.
3. Autocrítica e verificação de contradições
Peça ao modelo que revise sua própria saída:
> "Depois de terminar sua resposta, revise-a em busca de contradições ou afirmações que contradigam algo que você disse antes. Aponte quaisquer inconsistências que encontrar."
Os modelos frequentemente detectam seus próprios erros quando solicitados a refletir. O modelo pode então revisar a resposta antes que você a veja.
4. Use instruções negativas
Declare explicitamente o que o modelo NÃO deve fazer:
- "Nunca invente fontes, URLs ou nomes de autores sob nenhuma circunstância"
- "Não adivinhe datas se não tiver certeza — deixe a data em branco em vez de adivinhar"
- "Não adicione informações que não estejam no contexto fornecido"
O enquadramento negativo às vezes funciona melhor do que o enquadramento positivo para prevenir erros específicos.
5. Raciocínio passo a passo com verificação
Para tarefas complexas, pergunte:
> "Trabalhe isso passo a passo. Após cada etapa, verifique se a etapa anterior está correta antes de prosseguir para a próxima etapa."
Dividir a tarefa em partes menores com etapas de verificação dá ao modelo chances de detectar inconsistências antes que elas se acumulem.
6. Formato de saída estruturado com seção de evidências
Peça ao modelo que separe resposta, raciocínio e evidências em seções distintas:
``` RESPOSTA: Resposta direta
RACIOCÍNIO: Como você chegou a isso
EVIDÊNCIAS: Fontes, fatos ou citações que suportam isso
CONFIANÇA: Quão certo você está, e por quê? ```
Essa estrutura torna as alucinações fáceis de detectar: afirmações sem suporte terão seções de EVIDÊNCIAS vazias ou vagas e valores baixos de CONFIANÇA.
Estratégias em nível de sistema além do design de prompts
Os prompts sozinhos não são suficientes para trabalho de alto risco. Adicione essas ferramentas e fluxos de trabalho.
- Geração Aumentada por Recuperação (RAG). Forneça ao modelo um documento específico, base de conhecimento ou conjunto de dados e peça-lhe que responda usando apenas esse conteúdo. Isso fundamenta as respostas em dados reais em vez dos dados de treinamento do modelo e elimina alucinações sobre informações ausentes. Ferramentas como LangChain, cache de prompts da Anthropic e bancos de dados vetoriais implementam esse padrão. Consulte nosso guia completo sobre RAG: como fundamentar respostas de IA em dados reais.
- Chamada de ferramentas e uso de funções. Permita que o modelo chame funções externas para cálculos, pesquisas em banco de dados ou verificação de fatos. Em vez de inventar uma estatística, o modelo chama uma função para recuperá-la. Isso remove completamente a tentação de alucinar para domínios específicos.
- Revisão humana e verificação por especialistas. Para decisões críticas — médicas, jurídicas, financeiras, críticas para segurança — sempre tenha um humano (de preferência um especialista) verificando as respostas geradas por IA. Nenhuma técnica de prompt substitui o julgamento de um especialista.
- Fluxos de trabalho de verificação de fatos automatizados. Execute as saídas do modelo por sistemas automatizados (APIs de verificação de fatos, validação de URL, verificação de citações) antes de mostrá-las aos usuários. Isso detecta alucinações em escala sem revisão manual de cada saída.
Múltiplos modelos e detecção de consenso
Um único modelo pode alucinar com confiança. Mas quando você faz a mesma pergunta a vários modelos independentes, eles frequentemente discordam sobre afirmações alucinadas.
Se cinco modelos produzem de forma independente respostas semelhantes a uma pergunta, essa resposta é muito mais provável de estar correta do que se apenas um modelo responder. Se apenas um modelo afirma algo e quatro outros não o mencionam, essa afirmação é altamente suspeita e justifica verificação.
Esse é o princípio por trás da pontuação de consenso: enviar o mesmo prompt para muitos modelos (GPT-5.5, Claude Opus 4.8, Gemini 3.5 Pro, Mistral Large, Llama 3, DeepSeek, etc.) e analisar onde eles concordam e discordam.
Teste de consenso do PromptQuorum
Testado no PromptQuorum — 15 prompts propensos a alucinações enviados para GPT-5.5, Claude Opus 4.8 e Gemini 3.5 Pro: GPT-5.5 fabricou 1 citação completamente; Claude Opus 4.8 recusou-se a citar artigos não verificados; Gemini 3.5 Pro citou 3 artigos reais mas 1 com o ano incorreto. Apenas 1 citação apareceu nas três respostas dos modelos. Este teste demonstra que o consenso entre os modelos é um sinal significativo de confiabilidade — e que as respostas de modelos únicos têm maior probabilidade de conter fabricações.
O PromptQuorum automatiza isso: envie um prompt para 25+ modelos de IA simultaneamente, execute análise de consenso em todas as respostas e obtenha um veredicto sobre quais afirmações têm alto acordo (mais provavelmente confiáveis) e quais têm baixo acordo (valem investigação adicional). A ferramenta sinaliza exatamente quais afirmações contradizem, revela afirmações que aparecem em apenas uma ou duas respostas e pondera as respostas dos modelos por capacidade — transformando a detecção de alucinações de suposições em análise estruturada baseada em dados.
Veja como a IA multi-modelo reduz alucinações para uma explicação técnica mais profunda.
Perspectivas globais sobre governança de alucinações
O risco de alucinação e as estratégias de mitigação variam por região e contexto regulatório. Na Europa, a Lei de IA da UE enfatiza transparência e relatórios de erros para sistemas de IA de alto risco, tornando a documentação de alucinações obrigatória. Mistral AI (França) construiu modelos com foco específico em redução de alucinações em aplicações compatíveis com a UE. Na China, modelos como Qwen 3 e DeepSeek têm padrões de alucinação diferentes devido à composição dos dados de treinamento e eficiência de tokenização para idiomas CJK (chinês, japonês, coreano) — esses modelos lidam com proporções de token-para-informação de forma diferente dos modelos otimizados para inglês. No Brasil, empresas que operam sob a LGPD (Lei Geral de Proteção de Dados) e as diretrizes da ANPD devem documentar riscos de alucinação ao usar IA para processar dados pessoais, especialmente em setores de saúde, financeiro e jurídico.
Independentemente da região, as técnicas principais (RAG, verificação de consenso, revisão humana) permanecem universalmente aplicáveis. Escolha e verifique os modelos com base no seu contexto regulatório e requisitos de idioma.
Quando as alucinações são mais perigosas
As alucinações representam risco significativo de dano em domínios específicos. Tenha especial cuidado com:
- Decisões médicas e de saúde — Nomes de medicamentos, dosagens ou interpretações de sintomas errados podem prejudicar pacientes
- Questões jurídicas e de conformidade — Jurisprudência inventada, requisitos regulatórios ou precedentes podem levar a erros custosos ou violações
- Conselhos financeiros — Dados de mercado falsos, informações tributárias incorretas ou métricas de desempenho fabricadas induzem decisões de alto risco ao erro
- Sistemas críticos para segurança — Alucinações em revisão de código, decisões de arquitetura ou análise de segurança podem introduzir vulnerabilidades ou bugs
- Atribuição pública — Qualquer coisa publicada sob seu nome ou marca deve ser verificada; alucinações danificam a credibilidade
Princípio crítico: Mesmo com prompts perfeitos e verificação de consenso, a verificação humana permanece essencial para decisões de alto risco. Use a IA como uma ferramenta de economia de tempo e primeira passagem, não como substituta do julgamento de especialistas ou verificação de fontes primárias.
Aprenda como técnicas de autocrítica podem reduzir ainda mais os erros em tarefas de raciocínio complexo.
Lista de verificação prática: antes de enviar um prompt crítico
Use esta lista de verificação antes de enviar um prompt no qual você confiará para decisões ou saída pública:
- O prompt permite explicitamente "Não sei"? Adicione: "Você pode dizer 'Não sei' se não tiver certeza."
- Há contexto ou dados reais no prompt? Prompts vagos convidam à invenção. Forneça documentos específicos, exemplos ou dados de entrada.
- As restrições são explícitas? Declare o que o modelo NÃO deve fazer, especialmente: "Não invente fontes, URLs ou citações."
- O formato de saída é estruturado? Separe Resposta / Raciocínio / Evidências / Confiança. Isso torna as afirmações sem suporte óbvias.
- Você está solicitando fontes? Para qualquer afirmação factual, exija: "Cite a fonte para este fato."
- A tarefa é específica, não aberta? "Liste cinco estratégias de marketing *para um produto B2B SaaS voltado a profissionais de finanças*" é melhor do que "Me fale sobre marketing."
- Você pediu ao modelo para se autoavaliar? Adicione: "Revise sua resposta em busca de contradições antes de enviá-la."
- Para decisões de alto risco, você está cruzando verificações? Envie o mesmo prompt para vários modelos e compare as respostas.
Exemplo de prompt antes/depois
Prompt ruim
Por que isso falha: Aberto, sem restrições, sem permissão para admitir incerteza. O modelo inventará datas, atribuirá avanços incorretamente, afirmará com confiança informações desatualizadas e potencialmente citará artigos que não existem.
Me conte sobre a história da inteligência artificial. Inclua grandes avanços e pesquisadores importantes.
Prompt bom
Usando apenas a seguinte linha do tempo, resuma os principais avanços em IA de 1950 a 1990: {DADOS DA LINHA DO TEMPO INSERIDOS} Formate sua resposta como: AVANÇO: {Nome} ANO: {Ano — apenas se indicado na linha do tempo} SIGNIFICADO: {O que ele possibilitou} FONTE: {Qual documento da linha do tempo menciona isso?} Não adicione informações que não estejam na linha do tempo. Se não tiver certeza se algo está na linha do tempo, pule em vez de adivinhar.
Por que isso funciona:
- Dados reais em vez de invenção: O modelo trabalha a partir do contexto fornecido, não das lacunas dos dados de treinamento
- Saída estruturada: O formato torna as fontes ausentes imediatamente óbvias
- Instrução negativa: "Não adicione informações que não estejam na linha do tempo" é explícita
- Permissão para omitir: "Se não tiver certeza, pule" remove a pressão de inventar detalhes
- Responsabilidade de fontes: Cada afirmação exige citar de qual documento ela veio
Como reduzir alucinações de IA: 6 técnicas de prompt
- 1Dê permissão explícita para dizer "Não sei": Adicione a cada prompt factual: "Se você não tiver certeza, diga 'Não sei' em vez de adivinhar." Isso sozinho elimina uma grande classe de fabricações confiantes.
- 2Solicite fontes ou evidências: Instrua o modelo a citar uma fonte para cada afirmação, ou sinalizar afirmações que não pode verificar. Exemplo: "Após cada fato, anote o nome da fonte ou 'não verificado'."
- 3Adicione uma etapa de autocrítica: Peça ao modelo que revise sua própria saída antes de finalizar. Exemplo: "Antes de responder, liste quaisquer afirmações sobre as quais você está menos de 90% confiante."
- 4Use instruções negativas: Proíba explicitamente comportamentos propensos a alucinações. Exemplo: "Não invente nomes, títulos ou estatísticas. Não extrapole além do contexto fornecido."
- 5Exija raciocínio passo a passo: O prompting chain-of-thought força o modelo a mostrar seu trabalho, tornando os erros detectáveis antes de chegarem à resposta final.
- 6Despache para vários modelos com o PromptQuorum: Envie o mesmo prompt para GPT-5.5, Claude e Gemini simultaneamente. Fatos confirmados pelos três têm alta confiança; respostas divergentes sinalizam afirmações que precisam de verificação.
Perguntas frequentes
As alucinações podem ser completamente eliminadas?
Não. As alucinações são inerentes ao funcionamento dos modelos de linguagem — eles preveem padrões de texto em vez de recuperar fatos de um armazenamento verificado. Você pode reduzi-las significativamente com bom design de prompts, ferramentas como RAG e consenso multi-modelo, mas eliminá-las completamente não é possível com a arquitetura LLM atual. A verificação humana permanece necessária para decisões de alto risco.
Por que o modelo parece tão confiante quando está errado?
Os modelos de linguagem são treinados para gerar texto fluente e coerente. A confiança é um subproduto da coerência linguística. Uma afirmação falsa pode ser muito mais coerente e bem articulada do que uma admissão honesta de incerteza. O modelo não tem mecanismo incorporado para expressar dúvida — ele produz texto com a mesma confiança fluente independentemente da precisão.
Modelos mais novos e maiores alucinam menos?
Modelos maiores frequentemente alucinam mais em algumas tarefas porque são melhores em gerar texto plausível, tornando as afirmações falsas mais difíceis de detectar. No entanto, modelos mais novos têm melhor desempenho em algumas tarefas factuais (têm dados de treinamento mais recentes e seguimento de instruções mais forte). A relação entre tamanho do modelo e alucinação depende da tarefa, não é monotônica.
Conectar um modelo à internet elimina as alucinações?
Parcialmente. O acesso à web em tempo real ajuda com eventos atuais e fatos recentes, mas não resolve o problema central: o modelo ainda inventa detalhes, interpreta mal os resultados de pesquisa ou alucina sobre conteúdo que não recuperou realmente. O acesso à internet é uma ferramenta que reduz uma classe de alucinações, não uma cura.
Como posso verificar rapidamente se uma resposta alucinada?
Verifique as fontes: Clique nas URLs ou pesquise os artigos citados. Se não existirem, a resposta alucinada. Verifique os fatos: Confira datas, nomes e números com fontes confiáveis. Compare vários modelos: Faça a mesma pergunta a modelos diferentes. Forte desacordo sugere que pelo menos um está alucinando. Aplique conhecimento de domínio: Se você conhece o campo, leia criticamente em busca de implausibilidade sutil — alucinações frequentemente têm sinais reveladores para leitores especialistas.
Devo parar de usar IA se ela alucina?
Não. Use IA estrategicamente com verificação. Para brainstorming, rascunhos e trabalho exploratório, alucinações são um incômodo menor. Para trabalho crítico de fatos (pesquisa, conformidade, decisões médicas, conselhos financeiros), use IA como ponto de partida e verifique tudo com fontes confiáveis ou revisão especializada.
Qual é a diferença entre uma alucinação e um erro genuíno?
Uma alucinação é confiante e falsa. Se um modelo diz "Não tenho certeza, mas pode ser X," isso é incerteza honesta, não alucinação. Se diz "A capital da França é Berlim" com plena confiança, isso é uma alucinação — o modelo afirmou algo falso como se fosse um fato. A marca registrada é a afirmação confiante de algo falso.
Leitura relacionada
- O que é Prompt Engineering? — os conceitos fundamentais por trás da estruturação de prompts
- Pontuação de Consenso Multi-Modelo — como comparar modelos detecta discordâncias e falta de confiabilidade
- Técnicas de Prompting de Autocrítica — como fazer os modelos detectarem seus próprios erros
- Limitações da IA: O que os LLMs não podem fazer — as oito restrições estruturais que todo LLM compartilha e a solução de engenharia para cada uma
Fontes
- Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." ArXiv — o artigo fundacional demonstrando que o raciocínio passo a passo reduz alucinações em tarefas de matemática e lógica.
- Maynez, J., Narayan, S., Hashimoto, B., & Hardt, D. (2021). "On Faithfulness and Factuality in Abstractive Summarization." ACL Proceedings — estudo empírico das taxas e mecanismos de alucinação na geração de texto neural.
- Anthropic (2024). "Constitutional AI." https://www.anthropic.com/constitutional-ai — abordagem da Anthropic para reduzir saídas prejudiciais e alucinações por meio de treinamento baseado em princípios.