Skip to main content
PromptQuorumPromptQuorum
Início/Prompt Engineering/Chain-of-Thought Prompting: Faça a IA mostrar seu raciocínio
Techniques

Chain-of-Thought Prompting: Faça a IA mostrar seu raciocínio

·13 min de leitura·Por Hans Kuepper · Fundador da PromptQuorum, ferramenta de despacho multimodelo · PromptQuorum

O chain-of-thought prompting é uma técnica em que você pede explicitamente ao modelo que mostre suas etapas de raciocínio em vez de pular diretamente para a resposta final. Isso torna decisões complexas mais fáceis de auditar, depurar e melhorar ao longo do tempo.

O chain-of-thought (CoT) prompting instrui um modelo de IA a mostrar seu raciocínio passo a passo antes de dar uma resposta final. Isso melhora a precisão em tarefas de matemática, lógica e múltiplas etapas. Em 2026, modelos de fronteira como Claude Opus 4.8 e OpenAI o3 têm modos de raciocínio integrados que automatizam o CoT internamente, mas o CoT no nível do prompt ainda é valioso em modelos menores e sem raciocínio integrado, onde é a principal forma de eliciar pensamento estruturado.

  1. 1
    O chain-of-thought prompting pede aos modelos que mostrem as etapas de raciocínio antes de dar uma resposta final, melhorando a precisão em tarefas de matemática, lógica e múltiplas etapas.
  2. 2
    O CoT zero-shot ("pense passo a passo") funciona na maioria dos modelos. O CoT few-shot (com exemplos resolvidos) é mais confiável.
  3. 3
    Em 2026, modelos de fronteira como Claude Opus 4.8 e OpenAI o3 têm modos de raciocínio integrados que substituem o CoT no nível do prompt; você não precisa dizer "pense passo a passo" nesses modelos.
  4. 4
    O CoT aumenta os tokens de saída e, portanto, o custo. Os modos de raciocínio integrados adicionam orçamentos de tokens de pensamento separados com sua própria cobrança.
  5. 5
    Use CoT no nível do prompt em modelos sem raciocínio (Haiku, Flash, LLaMA 4) para raciocínio econômico. Use modos de raciocínio integrados em modelos de fronteira para máxima precisão.
  6. 6
    O CoT é mais valioso para matemática, lógica, planejamento e análise de causa raiz. Omita-o para classificação simples, respostas curtas e redação rápida.

Dados rápidos

  1. 1
    Cunhado por: Wei et al. (2022), Google Brain — artigo fundacional no NeurIPS 2022
  2. 2
    Resultado-chave: CoT zero-shot elevou a precisão do PaLM 540B de 17,7% para 78,7% no MultiArith
  3. 3
    Frase ativadora: "Vamos pensar passo a passo" (zero-shot) ou exemplos resolvidos (few-shot)
  4. 4
    Evolução em 2026: Os modos de raciocínio integrados (o3, Claude extended thinking) automatizam o CoT internamente
  5. 5
    Impacto no custo: CoT no nível do prompt = mais tokens de saída; modos de raciocínio = orçamento de tokens de pensamento separado
  6. 6
    Melhores modelos para CoT no nível do prompt: Modelos sem raciocínio (Claude Haiku 4.5, Gemini Flash, GPT-5.5 mini, LLaMA 4 Scout)

O que é o chain-of-thought prompting

O chain-of-thought prompting pede ao modelo que raciocine passo a passo antes de chegar a uma conclusão final. Em vez de retornar apenas "a resposta", o modelo escreve cálculos intermediários, etapas lógicas ou explicações.

Você pode ativar esse comportamento com instruções como "pense passo a passo", "mostre seu raciocínio" ou fornecendo exemplos resolvidos onde o raciocínio é explícito. O resultado é um rastro que você pode ler para entender como o modelo chegou à sua conclusão.

Por que o chain-of-thought prompting importa

O chain-of-thought prompting importa porque torna o comportamento do modelo mais transparente em tarefas que envolvem raciocínio de múltiplas etapas. Quando você vê cada etapa, pode detectar interpretações equivocadas, suposições ausentes ou erros aritméticos.

Isso é especialmente valioso em áreas como análise, planejamento e resolução de problemas. Em vez de uma saída opaca, você obtém uma narrativa que pode verificar, corrigir ou reutilizar como documentação.

🔍 Funciona com modelos locais

Chain-of-thought funciona em qualquer modelo com 7B+ parâmetros. Experimente localmente com Ollama ou LM Studio.

Quando o chain-of-thought ajuda (e quando não)

O chain-of-thought prompting ajuda mais em tarefas que se dividem naturalmente em etapas claras, mas não é necessário para cada prompt. Brilha onde o caminho é tão importante quanto o destino.

Os bons casos de uso incluem:

  • Problemas matemáticos e de raciocínio quantitativo.
  • Puzzles lógicos de múltiplas etapas ou análise de decisões.
  • Análise de causa raiz, post-mortems de incidentes e discussões de compensações.
  • Tarefas de planejamento onde a sequência de ações deve ser explícita.

Para classificação simples, redação rápida ou respostas factuais curtas, o chain-of-thought frequentemente adiciona verbosidade sem muito valor adicional.

Exemplo: Sem e com chain-of-thought

A diferença fica clara quando você compara um prompt de resposta direta com um que pede raciocínio explicitamente.

Prompt deficiente

"Qual projeto devemos priorizar no próximo trimestre?"

Prompt melhorado

"Você é um gerente de operações de produto. Temos três projetos candidatos para o próximo trimestre. Use raciocínio chain-of-thought para decidir qual projeto priorizar. 1) Liste os critérios de decisão que você usará (por exemplo, impacto na receita, risco, alinhamento com a estratégia). 2) Avalie cada projeto em relação a esses critérios passo a passo. 3) Faça uma recomendação clara e justifique-a em 3–5 frases. No final, forneça uma resposta final curta começando com `Recomendação:` em uma linha separada."

Como escrever prompts chain-of-thought eficazes

Para escrever prompts chain-of-thought eficazes, você deve definir a estrutura do raciocínio e a estrutura da resposta final. Solicitações vagas como "explique mais" são menos confiáveis do que instruções concretas.

Um padrão prático é:

  • Diga ao modelo seu papel (por exemplo, "Você é um analista de dados sênior.").
  • Especifique que deve pensar passo a passo ou usar chain-of-thought.
  • Defina as seções de raciocínio que você espera (por exemplo, suposições, cálculos, comparação, conclusão).
  • Peça uma resposta final curta e claramente marcada no final para que você possa usá-la rapidamente.

Isso separa o raciocínio detalhado da saída concisa, o que é útil quando você integra o resultado em outras ferramentas ou relatórios.

Chain-of-thought prompting no PromptQuorum

O PromptQuorum é uma ferramenta de despacho de IA multi-modelo onde você pode aplicar chain-of-thought prompting de forma consistente em diferentes modelos. Você escreve um prompt chain-of-thought estruturado e o envia para vários provedores em paralelo.

No PromptQuorum você pode:

  • Combinar instruções chain-of-thought com frameworks orientados ao raciocínio como TRACE ou APE para que as etapas de pensamento sejam explicitamente rotuladas.
  • Comparar como diferentes modelos lidam com a mesma tarefa de raciocínio e inspecionar seus rastros passo a passo lado a lado.
  • Salvar prompts chain-of-thought como modelos para análises recorrentes, revisões de incidentes ou decisões estratégicas.

Isso transforma o chain-of-thought prompting de um truque pontual em uma parte repetível do seu processo de tomada de decisões.

Como usar o CoT prompting

  1. 1
    Para tarefas de lógica, raciocínio ou depuração, peça ao modelo que "pense passo a passo" antes de responder. Em vez de "qual é o bug?", pergunte "Siga a execução passo a passo, depois identifique o bug."
  2. 2
    Forneça um exemplo resolvido que mostre o raciocínio passo a passo. Não apenas descreva — mostre ao modelo como o raciocínio passo a passo se parece. Exemplo: "Primeiro, reviso a assinatura da função... Depois, sigo a primeira chamada com a entrada X..."
  3. 3
    Use prompts explícitos como "Vamos pensar passo a passo" ou "Primeiro, identifique... Depois..." Esses ativam um raciocínio mais deliberado no modelo.
  4. 4
    Para problemas complexos, peça ao modelo que rastreie as saídas intermediárias. Exemplo: "Siga a execução desta função para a entrada 5. Mostre o valor de cada variável após cada linha."
  5. 5
    Combine CoT com saídas verificáveis: peça ao modelo que mostre seu trabalho para que você possa auditá-lo. "Explique seu raciocínio em cada etapa. Se cometer um erro, ele deve ser visível no trabalho que você mostra."

Exemplo matemático: cálculo de receita

Sem CoT, um modelo pode dar uma única resposta final. Com CoT, o modelo mostra os cálculos passo a passo.

Sem CoT:

"Um cliente compra 50 unidades a R$15 cada, mas obtém 10% de desconto. Quanto paga?"

Modelo: "R$675"

Com CoT:

"Um cliente compra 50 unidades a R$15 cada, mas obtém 10% de desconto. Trabalhe isso passo a passo: 1) Calcule o subtotal. 2) Calcule o valor do desconto. 3) Subtraia o desconto do subtotal para obter o preço final."

Modelo: "1) Subtotal = 50 × R$15 = R$750. 2) Desconto = 10% de R$750 = R$75. 3) Preço final = R$750 − R$75 = R$675."

CoT vs modelos de raciocínio integrados (2026)

Em 2026, modelos de fronteira — Claude Opus 4.8, OpenAI o3, Gemini Deep Think — têm modos de raciocínio integrados que internalizam chain-of-thought automaticamente. Você não precisa adicionar instruções "pense passo a passo" nesses modelos.

Quando usar CoT no nível do prompt: Modelos sem raciocínio (Claude Haiku 4.5, GPT-5.5 mini, Gemini Flash, Llama 4), LLMs locais, ou quando você quer evitar o custo extra dos orçamentos de tokens de raciocínio.

Quando usar modos de raciocínio integrados: Máxima precisão em modelos de fronteira, tarefas com muita matemática, análise complexa.

AbordagemMelhor paraCustoTransparênciaModelos
CoT no nível do prompt ("pense passo a passo")Modelos pequenos, LLMs locais, tarefas sensíveis ao custoAumenta os tokens de saídaTotal: etapas visíveis na saídaHaiku, Flash, LLaMA, Qwen
Claude extended thinking (Opus 4.8, Sonnet 4.6)Análise complexa, máxima precisãoOrçamento de tokens de pensamento separado (taxa de entrada)Rastro de inspetor via APIClaude Opus 4.8, Claude Sonnet 4.6
OpenAI o3Problemas mais difíceis (matemática, código, competição)Orçamento de tokens de raciocínio (nível mais alto)Raciocínio oculto, saída visívelOpenAI o3
Gemini Deep ThinkIntegração com Google Cloud, ecossistema GeminiTokens de pensamento separados da saídaParâmetro thinking_level (LOW, MEDIUM, HIGH)Gemini 3.1 Pro
DeepSeek R1Opção open-weights, raciocínio no dispositivoRaciocínio visível transmitido como texto de saídaTotal: CoT inline na saídaDeepSeek R1

💡 Dica profissional

Se você está construindo pensando no custo, use CoT no nível do prompt em modelos menores. Se está construindo para precisão em problemas difíceis, use o3 ou Claude extended thinking e deixe o modelo gerenciar o raciocínio internamente.

Variantes e extensões de chain-of-thought

Além do padrão básico "pense passo a passo", os pesquisadores desenvolveram várias variantes de CoT, cada uma otimizada para diferentes tipos de problemas.

  • CoT zero-shot: Pergunta "Vamos pensar passo a passo" sem exemplos. Funciona na maioria dos modelos e é o mais simples de implementar. Melhoria: ~10–20% em tarefas de raciocínio.
  • CoT few-shot: Mostra 2–5 exemplos resolvidos onde o raciocínio é explícito, depois pede ao modelo que aplique o mesmo padrão a um novo problema. Mais confiável que zero-shot mas requer criar exemplos manualmente. Melhoria: ~20–40% de precisão.
  • Self-consistency (Wang et al., 2023): Gera múltiplos caminhos de raciocínio CoT de forma independente, depois faz uma votação majoritária na resposta final. Significativamente mais robusto contra erros. Melhoria: ~30–50% em tarefas difíceis.
  • Tree of Thought (ToT): Em vez de uma cadeia linear, explora múltiplos ramos de raciocínio e poda os fracos. Use quando há muitos caminhos de solução possíveis (planejamento, jogos, tarefas criativas).
  • ReAct (Reasoning + Acting): Intercala raciocínio com ações externas — chamar APIs, pesquisar em bancos de dados ou executar código — e incorpora os resultados na próxima etapa de raciocínio.

Comparação de modelos: como lidam com CoT prompting (2026)

ModeloCoT no nível do promptRaciocínio integradoMelhor caso de usoCusto (aprox.)
Claude Opus 4.8Não necessárioExtended thinking (rastro inspecionável via API)Análise de máxima precisãoMaior (input + output + tokens de pensamento)
Claude Sonnet 4.6Não necessárioExtended thinkingEquilíbrio precisão/custoMédio
Claude Haiku 4.5RecomendadoNenhumRaciocínio rápido e econômicoBaixo
OpenAI o3Não necessárioNíveis de esforço (low, medium, high, xhigh)Problemas de nível de competiçãoMuito alto (nível de tokens de raciocínio)
GPT-5.5 miniRecomendadoNenhumImplantação econômicaMuito baixo
Gemini 3.1 ProFuncionaDeep Think (parâmetro thinking_level)Integração com Google CloudMédio-alto
Gemini FlashRecomendadoNenhumRespostas rápidasBaixo
DeepSeek R1Não necessárioRaciocínio inline na saídaOpen-weights, no dispositivoGrátis (código aberto)
Llama 4RecomendadoNenhumImplantação local, privacidadeSelf-hosted (depende do cómputo)

Perguntas frequentes

O chain-of-thought funciona em todos os modelos?

O chain-of-thought funciona na maioria dos modelos com 7B+ parâmetros, mas o benefício varia. É mais eficaz em modelos médios e pequenos (Haiku, Flash, Llama 4). Em modelos de fronteira (Claude Opus 4.8, o3), os modos de raciocínio integrados geralmente são mais eficientes do que o CoT no nível do prompt.

O chain-of-thought aumenta o custo?

Sim, o CoT no nível do prompt aumenta o número de tokens de saída (já que o modelo escreve o raciocínio antes da resposta final). Os modos de raciocínio integrados (Claude extended thinking, OpenAI o3) usam orçamentos de tokens de pensamento separados com taxas de cobrança diferentes.

Quando devo usar CoT few-shot em vez de zero-shot?

Use CoT zero-shot primeiro — é mais simples e funciona na maioria dos casos. Passe para few-shot (com 2–5 exemplos) se zero-shot não for confiável ou se seu domínio exigir padrões de raciocínio específicos.

Posso combinar chain-of-thought com saída estruturada (JSON)?

Sim. Você pode pedir ao modelo que mostre seu raciocínio em texto simples primeiro, depois que produza um objeto JSON com a resposta final. Combine as instruções: "Pense passo a passo. Depois produza seu resultado como JSON válido."

Qual é a diferença entre chain-of-thought e tree-of-thought?

Chain-of-thought é uma sequência linear: etapa 1 → etapa 2 → ... → conclusão. Tree-of-thought explora múltiplos ramos (caminhos de raciocínio alternativos) e poda os mais fracos antes de chegar à resposta. Tree-of-thought é mais poderoso mas mais caro (requer múltiplas chamadas ao modelo).

O OpenAI o3 requer chain-of-thought prompting?

Não. O OpenAI o3 tem raciocínio integrado que se ativa automaticamente. Você não precisa adicionar instruções "pense passo a passo". Basta dar a o3 o problema e definir o nível de esforço (low/medium/high/xhigh).

Posso auditar o raciocínio dos modelos de raciocínio integrados?

Sim, mas depende do modelo. Os rastros de raciocínio do Claude extended thinking são inspecionáveis via API. O raciocínio do OpenAI o3 está oculto por padrão. Para auditabilidade completa, use CoT no nível do prompt ou DeepSeek R1.

O chain-of-thought prompting é adequado para aplicações em tempo real?

O CoT no nível do prompt adiciona latência (mais tokens de saída = geração mais lenta). Para casos de uso em tempo real, use modelos menores com raciocínio mínimo, ou use endpoints de streaming para mostrar os tokens à medida que chegam.

Fontes e leituras adicionais

  • Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." NeurIPS 2022. arXiv:2201.11903
  • Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). "Large Language Models are Zero-Shot Reasoners." NeurIPS 2022. arXiv:2205.11916
  • Wang, X., Wei, J., Schuurmans, D., et al. (2023). "Self-Consistency Improves Chain of Thought Reasoning in Language Models." ICLR 2023. arXiv:2203.11171
  • Anthropic. (2024). "Extended Thinking in Claude." Documentação técnica sobre as capacidades de raciocínio do Claude Opus 4.8 e Sonnet 4.6.
  • OpenAI. (2026). "OpenAI o3: Reasoning Models for Competition-Level Problem Solving." Documentação e pesquisa da OpenAI.

Aplique estas técnicas em mais de 25 modelos de IA simultaneamente com PromptQuorum.

Experimente o PromptQuorum grátis →

← Voltar para Prompt Engineering

Chain-of-Thought Prompting: Aumente a Precisão em 40%