Início/Prompt Engineering/Chain-of-Thought Prompting: Faça a IA mostrar seu raciocínio

Techniques

Chain-of-Thought Prompting: Faça a IA mostrar seu raciocínio

Última atualização: March 2026·13 min de leitura·Por Hans Kuepper · Fundador da PromptQuorum, ferramenta de despacho multimodelo · PromptQuorum

Ler em:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt

O chain-of-thought prompting é uma técnica em que você pede explicitamente ao modelo que mostre suas etapas de raciocínio em vez de pular diretamente para a resposta final. Isso torna decisões complexas mais fáceis de auditar, depurar e melhorar ao longo do tempo.

O chain-of-thought (CoT) prompting instrui um modelo de IA a mostrar seu raciocínio passo a passo antes de dar uma resposta final. Isso melhora a precisão em tarefas de matemática, lógica e múltiplas etapas. Em 2026, modelos de fronteira como Claude Opus 4.8 e OpenAI o3 têm modos de raciocínio integrados que automatizam o CoT internamente, mas o CoT no nível do prompt ainda é valioso em modelos menores e sem raciocínio integrado, onde é a principal forma de eliciar pensamento estruturado.

1
O chain-of-thought prompting pede aos modelos que mostrem as etapas de raciocínio antes de dar uma resposta final, melhorando a precisão em tarefas de matemática, lógica e múltiplas etapas.
2
O CoT zero-shot ("pense passo a passo") funciona na maioria dos modelos. O CoT few-shot (com exemplos resolvidos) é mais confiável.
3
Em 2026, modelos de fronteira como Claude Opus 4.8 e OpenAI o3 têm modos de raciocínio integrados que substituem o CoT no nível do prompt; você não precisa dizer "pense passo a passo" nesses modelos.
4
O CoT aumenta os tokens de saída e, portanto, o custo. Os modos de raciocínio integrados adicionam orçamentos de tokens de pensamento separados com sua própria cobrança.
5
Use CoT no nível do prompt em modelos sem raciocínio (Haiku, Flash, LLaMA 4) para raciocínio econômico. Use modos de raciocínio integrados em modelos de fronteira para máxima precisão.
6
O CoT é mais valioso para matemática, lógica, planejamento e análise de causa raiz. Omita-o para classificação simples, respostas curtas e redação rápida.

Dados rápidos

1
Cunhado por: Wei et al. (2022), Google Brain — artigo fundacional no NeurIPS 2022
2
Resultado-chave: CoT zero-shot elevou a precisão do PaLM 540B de 17,7% para 78,7% no MultiArith
3
Frase ativadora: "Vamos pensar passo a passo" (zero-shot) ou exemplos resolvidos (few-shot)
4
Evolução em 2026: Os modos de raciocínio integrados (o3, Claude extended thinking) automatizam o CoT internamente
5
Impacto no custo: CoT no nível do prompt = mais tokens de saída; modos de raciocínio = orçamento de tokens de pensamento separado
6
Melhores modelos para CoT no nível do prompt: Modelos sem raciocínio (Claude Haiku 4.5, Gemini Flash, GPT-5.5 mini, LLaMA 4 Scout)

O que é o chain-of-thought prompting

O chain-of-thought prompting pede ao modelo que raciocine passo a passo antes de chegar a uma conclusão final. Em vez de retornar apenas "a resposta", o modelo escreve cálculos intermediários, etapas lógicas ou explicações.

Você pode ativar esse comportamento com instruções como "pense passo a passo", "mostre seu raciocínio" ou fornecendo exemplos resolvidos onde o raciocínio é explícito. O resultado é um rastro que você pode ler para entender como o modelo chegou à sua conclusão.

Por que o chain-of-thought prompting importa

O chain-of-thought prompting importa porque torna o comportamento do modelo mais transparente em tarefas que envolvem raciocínio de múltiplas etapas. Quando você vê cada etapa, pode detectar interpretações equivocadas, suposições ausentes ou erros aritméticos.

Isso é especialmente valioso em áreas como análise, planejamento e resolução de problemas. Em vez de uma saída opaca, você obtém uma narrativa que pode verificar, corrigir ou reutilizar como documentação.

🔍 Funciona com modelos locais

Chain-of-thought funciona em qualquer modelo com 7B+ parâmetros. Experimente localmente com Ollama ou LM Studio.

Quando o chain-of-thought ajuda (e quando não)

O chain-of-thought prompting ajuda mais em tarefas que se dividem naturalmente em etapas claras, mas não é necessário para cada prompt. Brilha onde o caminho é tão importante quanto o destino.

Os bons casos de uso incluem:

Problemas matemáticos e de raciocínio quantitativo.
Puzzles lógicos de múltiplas etapas ou análise de decisões.
Análise de causa raiz, post-mortems de incidentes e discussões de compensações.
Tarefas de planejamento onde a sequência de ações deve ser explícita.

Para classificação simples, redação rápida ou respostas factuais curtas, o chain-of-thought frequentemente adiciona verbosidade sem muito valor adicional.

Exemplo: Sem e com chain-of-thought

A diferença fica clara quando você compara um prompt de resposta direta com um que pede raciocínio explicitamente.

Prompt deficiente

"Qual projeto devemos priorizar no próximo trimestre?"

Prompt melhorado

"Você é um gerente de operações de produto. Temos três projetos candidatos para o próximo trimestre. Use raciocínio chain-of-thought para decidir qual projeto priorizar. 1) Liste os critérios de decisão que você usará (por exemplo, impacto na receita, risco, alinhamento com a estratégia). 2) Avalie cada projeto em relação a esses critérios passo a passo. 3) Faça uma recomendação clara e justifique-a em 3–5 frases. No final, forneça uma resposta final curta começando com `Recomendação:` em uma linha separada."

Como escrever prompts chain-of-thought eficazes

Para escrever prompts chain-of-thought eficazes, você deve definir a estrutura do raciocínio e a estrutura da resposta final. Solicitações vagas como "explique mais" são menos confiáveis do que instruções concretas.

Um padrão prático é:

Diga ao modelo seu papel (por exemplo, "Você é um analista de dados sênior.").
Especifique que deve pensar passo a passo ou usar chain-of-thought.
Defina as seções de raciocínio que você espera (por exemplo, suposições, cálculos, comparação, conclusão).
Peça uma resposta final curta e claramente marcada no final para que você possa usá-la rapidamente.

Isso separa o raciocínio detalhado da saída concisa, o que é útil quando você integra o resultado em outras ferramentas ou relatórios.

Chain-of-thought prompting no PromptQuorum

O PromptQuorum é uma ferramenta de despacho de IA multi-modelo onde você pode aplicar chain-of-thought prompting de forma consistente em diferentes modelos. Você escreve um prompt chain-of-thought estruturado e o envia para vários provedores em paralelo.

No PromptQuorum você pode:

Combinar instruções chain-of-thought com frameworks orientados ao raciocínio como TRACE ou APE para que as etapas de pensamento sejam explicitamente rotuladas.
Comparar como diferentes modelos lidam com a mesma tarefa de raciocínio e inspecionar seus rastros passo a passo lado a lado.
Salvar prompts chain-of-thought como modelos para análises recorrentes, revisões de incidentes ou decisões estratégicas.

Isso transforma o chain-of-thought prompting de um truque pontual em uma parte repetível do seu processo de tomada de decisões.

Como usar o CoT prompting

1
Para tarefas de lógica, raciocínio ou depuração, peça ao modelo que "pense passo a passo" antes de responder. Em vez de "qual é o bug?", pergunte "Siga a execução passo a passo, depois identifique o bug."
2
Forneça um exemplo resolvido que mostre o raciocínio passo a passo. Não apenas descreva — mostre ao modelo como o raciocínio passo a passo se parece. Exemplo: "Primeiro, reviso a assinatura da função... Depois, sigo a primeira chamada com a entrada X..."
3
Use prompts explícitos como "Vamos pensar passo a passo" ou "Primeiro, identifique... Depois..." Esses ativam um raciocínio mais deliberado no modelo.
4
Para problemas complexos, peça ao modelo que rastreie as saídas intermediárias. Exemplo: "Siga a execução desta função para a entrada 5. Mostre o valor de cada variável após cada linha."
5
Combine CoT com saídas verificáveis: peça ao modelo que mostre seu trabalho para que você possa auditá-lo. "Explique seu raciocínio em cada etapa. Se cometer um erro, ele deve ser visível no trabalho que você mostra."

Exemplo matemático: cálculo de receita

Sem CoT, um modelo pode dar uma única resposta final. Com CoT, o modelo mostra os cálculos passo a passo.

Sem CoT:

"Um cliente compra 50 unidades a R$15 cada, mas obtém 10% de desconto. Quanto paga?"

Modelo: "R$675"

Com CoT:

"Um cliente compra 50 unidades a R$15 cada, mas obtém 10% de desconto. Trabalhe isso passo a passo: 1) Calcule o subtotal. 2) Calcule o valor do desconto. 3) Subtraia o desconto do subtotal para obter o preço final."

Modelo: "1) Subtotal = 50 × R$15 = R$750. 2) Desconto = 10% de R$750 = R$75. 3) Preço final = R$750 − R$75 = R$675."

CoT vs modelos de raciocínio integrados (2026)

Em 2026, modelos de fronteira — Claude Opus 4.8, OpenAI o3, Gemini Deep Think — têm modos de raciocínio integrados que internalizam chain-of-thought automaticamente. Você não precisa adicionar instruções "pense passo a passo" nesses modelos.

Quando usar CoT no nível do prompt: Modelos sem raciocínio (Claude Haiku 4.5, GPT-5.5 mini, Gemini Flash, Llama 4), LLMs locais, ou quando você quer evitar o custo extra dos orçamentos de tokens de raciocínio.

Quando usar modos de raciocínio integrados: Máxima precisão em modelos de fronteira, tarefas com muita matemática, análise complexa.

Abordagem	Melhor para	Custo	Transparência	Modelos
CoT no nível do prompt ("pense passo a passo")	Modelos pequenos, LLMs locais, tarefas sensíveis ao custo	Aumenta os tokens de saída	Total: etapas visíveis na saída	Haiku, Flash, LLaMA, Qwen
Claude extended thinking (Opus 4.8, Sonnet 4.6)	Análise complexa, máxima precisão	Orçamento de tokens de pensamento separado (taxa de entrada)	Rastro de inspetor via API	Claude Opus 4.8, Claude Sonnet 4.6
OpenAI o3	Problemas mais difíceis (matemática, código, competição)	Orçamento de tokens de raciocínio (nível mais alto)	Raciocínio oculto, saída visível	OpenAI o3
Gemini Deep Think	Integração com Google Cloud, ecossistema Gemini	Tokens de pensamento separados da saída	Parâmetro thinking_level (LOW, MEDIUM, HIGH)	Gemini 3.1 Pro
DeepSeek R1	Opção open-weights, raciocínio no dispositivo	Raciocínio visível transmitido como texto de saída	Total: CoT inline na saída	DeepSeek R1

💡 Dica profissional

Se você está construindo pensando no custo, use CoT no nível do prompt em modelos menores. Se está construindo para precisão em problemas difíceis, use o3 ou Claude extended thinking e deixe o modelo gerenciar o raciocínio internamente.

Variantes e extensões de chain-of-thought

Além do padrão básico "pense passo a passo", os pesquisadores desenvolveram várias variantes de CoT, cada uma otimizada para diferentes tipos de problemas.

CoT zero-shot: Pergunta "Vamos pensar passo a passo" sem exemplos. Funciona na maioria dos modelos e é o mais simples de implementar. Melhoria: ~10–20% em tarefas de raciocínio.
CoT few-shot: Mostra 2–5 exemplos resolvidos onde o raciocínio é explícito, depois pede ao modelo que aplique o mesmo padrão a um novo problema. Mais confiável que zero-shot mas requer criar exemplos manualmente. Melhoria: ~20–40% de precisão.
Self-consistency (Wang et al., 2023): Gera múltiplos caminhos de raciocínio CoT de forma independente, depois faz uma votação majoritária na resposta final. Significativamente mais robusto contra erros. Melhoria: ~30–50% em tarefas difíceis.
Tree of Thought (ToT): Em vez de uma cadeia linear, explora múltiplos ramos de raciocínio e poda os fracos. Use quando há muitos caminhos de solução possíveis (planejamento, jogos, tarefas criativas).
ReAct (Reasoning + Acting): Intercala raciocínio com ações externas — chamar APIs, pesquisar em bancos de dados ou executar código — e incorpora os resultados na próxima etapa de raciocínio.

Comparação de modelos: como lidam com CoT prompting (2026)

Modelo	CoT no nível do prompt	Raciocínio integrado	Melhor caso de uso	Custo (aprox.)
Claude Opus 4.8	Não necessário	Extended thinking (rastro inspecionável via API)	Análise de máxima precisão	Maior (input + output + tokens de pensamento)
Claude Sonnet 4.6	Não necessário	Extended thinking	Equilíbrio precisão/custo	Médio
Claude Haiku 4.5	Recomendado	Nenhum	Raciocínio rápido e econômico	Baixo
OpenAI o3	Não necessário	Níveis de esforço (low, medium, high, xhigh)	Problemas de nível de competição	Muito alto (nível de tokens de raciocínio)
GPT-5.5 mini	Recomendado	Nenhum	Implantação econômica	Muito baixo
Gemini 3.1 Pro	Funciona	Deep Think (parâmetro thinking_level)	Integração com Google Cloud	Médio-alto
Gemini Flash	Recomendado	Nenhum	Respostas rápidas	Baixo
DeepSeek R1	Não necessário	Raciocínio inline na saída	Open-weights, no dispositivo	Grátis (código aberto)
Llama 4	Recomendado	Nenhum	Implantação local, privacidade	Self-hosted (depende do cómputo)

Leituras relacionadas

Perguntas frequentes

O chain-of-thought funciona em todos os modelos?

O chain-of-thought funciona na maioria dos modelos com 7B+ parâmetros, mas o benefício varia. É mais eficaz em modelos médios e pequenos (Haiku, Flash, Llama 4). Em modelos de fronteira (Claude Opus 4.8, o3), os modos de raciocínio integrados geralmente são mais eficientes do que o CoT no nível do prompt.

O chain-of-thought aumenta o custo?

Sim, o CoT no nível do prompt aumenta o número de tokens de saída (já que o modelo escreve o raciocínio antes da resposta final). Os modos de raciocínio integrados (Claude extended thinking, OpenAI o3) usam orçamentos de tokens de pensamento separados com taxas de cobrança diferentes.

Quando devo usar CoT few-shot em vez de zero-shot?

Use CoT zero-shot primeiro — é mais simples e funciona na maioria dos casos. Passe para few-shot (com 2–5 exemplos) se zero-shot não for confiável ou se seu domínio exigir padrões de raciocínio específicos.

Posso combinar chain-of-thought com saída estruturada (JSON)?

Sim. Você pode pedir ao modelo que mostre seu raciocínio em texto simples primeiro, depois que produza um objeto JSON com a resposta final. Combine as instruções: "Pense passo a passo. Depois produza seu resultado como JSON válido."

Qual é a diferença entre chain-of-thought e tree-of-thought?

Chain-of-thought é uma sequência linear: etapa 1 → etapa 2 → ... → conclusão. Tree-of-thought explora múltiplos ramos (caminhos de raciocínio alternativos) e poda os mais fracos antes de chegar à resposta. Tree-of-thought é mais poderoso mas mais caro (requer múltiplas chamadas ao modelo).

O OpenAI o3 requer chain-of-thought prompting?

Não. O OpenAI o3 tem raciocínio integrado que se ativa automaticamente. Você não precisa adicionar instruções "pense passo a passo". Basta dar a o3 o problema e definir o nível de esforço (low/medium/high/xhigh).

Posso auditar o raciocínio dos modelos de raciocínio integrados?

Sim, mas depende do modelo. Os rastros de raciocínio do Claude extended thinking são inspecionáveis via API. O raciocínio do OpenAI o3 está oculto por padrão. Para auditabilidade completa, use CoT no nível do prompt ou DeepSeek R1.

O chain-of-thought prompting é adequado para aplicações em tempo real?

O CoT no nível do prompt adiciona latência (mais tokens de saída = geração mais lenta). Para casos de uso em tempo real, use modelos menores com raciocínio mínimo, ou use endpoints de streaming para mostrar os tokens à medida que chegam.

Fontes e leituras adicionais

Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." NeurIPS 2022. arXiv:2201.11903
Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). "Large Language Models are Zero-Shot Reasoners." NeurIPS 2022. arXiv:2205.11916
Wang, X., Wei, J., Schuurmans, D., et al. (2023). "Self-Consistency Improves Chain of Thought Reasoning in Language Models." ICLR 2023. arXiv:2203.11171
Anthropic. (2024). "Extended Thinking in Claude." Documentação técnica sobre as capacidades de raciocínio do Claude Opus 4.8 e Sonnet 4.6.
OpenAI. (2026). "OpenAI o3: Reasoning Models for Competition-Level Problem Solving." Documentação e pesquisa da OpenAI.

Aplique estas técnicas em mais de 25 modelos de IA simultaneamente com PromptQuorum.

Experimente o PromptQuorum grátis →

← Voltar para Prompt Engineering