Skip to main content
PromptQuorumPromptQuorum
Início/Prompt Engineering/Fluxo de trabalho de prompt engineering para desenvolvedores: configuração de IDE, testes e integração CI/CD
Workflows & Automação

Fluxo de trabalho de prompt engineering para desenvolvedores: configuração de IDE, testes e integração CI/CD

·12 min de leitura·Por Hans Kuepper · Fundador da PromptQuorum, ferramenta de despacho multimodelo · PromptQuorum

Os desenvolvedores precisam de um fluxo de trabalho de prompt engineering que se encaixe em seu processo de desenvolvimento existente — controle de versões, CI/CD e testes locais — não de um ecossistema de ferramentas separado. O fluxo de trabalho cobre 5 etapas: escrever, testar localmente, versionar, controlar em CI/CD e monitorar em produção.

Os desenvolvedores precisam de um fluxo de trabalho de prompt engineering que se encaixe em seu processo de desenvolvimento existente — controle de versões, CI/CD e testes locais — não de um ecossistema de ferramentas separado. O fluxo de trabalho cobre 5 etapas.

⚡ Quick Facts

  • ·O loop de teste local com Promptfoo leva menos de 30 segundos: escrever, testar em 3 entradas, comparar com a linha de base, confirmar.
  • ·Armazene os prompts como arquivos .txt ou .ts em um diretório /prompts. Nomeie os arquivos: tarefa-versão.txt (ex.: customer-support-v3.txt).
  • ·Limite do gate CI/CD: comece em 85% de taxa de aprovação, suba para 95% após 3 meses de testes estáveis.
  • ·Cursor é o IDE recomendado para desenvolvedores TypeScript/Python. VS Code + Continue.dev para requisitos de código aberto/modelos locais.
  • ·Em produção, registre o identificador do prompt, o modelo, a latência, a contagem de tokens e a pontuação de qualidade por resposta.
  • ·Alerte se a pontuação de qualidade cair mais de 10% em uma janela deslizante de 24 horas.

Configuração de IDE para prompt engineering

📍 In One Sentence

Cursor e VS Code com Continue.dev são os dois IDEs que cobrem a maioria das necessidades de prompt engineering para desenvolvedores, com Cursor para fluxos de trabalho com API na nuvem e Continue.dev para requisitos de código aberto e modelos locais.

💬 In Plain Terms

Escolha o IDE em que você já passa a maior parte do tempo. Se você usa TypeScript ou Python e chama APIs na nuvem (OpenAI, Anthropic, Google), o Cursor adiciona menos fricção. Se você precisa executar modelos localmente ou tem requisitos de código aberto, o VS Code com Continue.dev é a opção certa.

Dois IDEs cobrem a maioria das necessidades de prompt engineering para desenvolvedores: Cursor (integração nativa de IA, prompts como cidadãos de primeira classe) e VS Code com Continue.dev (código aberto, suporte de modelos locais). A escolha depende da sua linguagem principal e dos requisitos de acesso ao modelo.

O Cursor trata os arquivos de prompt de forma nativa — você pode referenciar, editar e testar prompts diretamente no editor junto com o código da sua aplicação. Ele tem integração nativa com APIs compatíveis com OpenAI e suporta bem TypeScript e Python. Use o Cursor se você trabalha principalmente nessas linguagens.

O VS Code com Continue.dev é de código aberto, suporta modelos locais via Ollama e funciona com qualquer ecossistema de linguagens. O Continue.dev fornece preenchimento e modificação de prompts no editor. Use o VS Code + Continue.dev para requisitos de código aberto ou quando precisar executar modelos localmente.

💡 Cursor para velocidade de iteração de prompts

O Cursor permite executar Claude 4.6 Sonnet diretamente sobre arquivos de prompt a partir do editor. Isso reduz o ciclo de escrita-teste de minutos para segundos para equipes que já usam o Cursor para código.

O loop de teste local

O loop de teste local tem 4 passos: escrever o prompt, testá-lo em 3 entradas representativas, comparar com a linha de base e confirmar se passa. Este loop deve levar menos de 30 segundos com o Promptfoo configurado localmente.

Passo 1: Escrever ou editar o prompt no seu IDE. Passo 2: Executar o prompt em 3 entradas representativas — uma entrada típica, um caso limite e uma que causou uma falha anteriormente. Passo 3: Comparar a saída com a linha de base (a última versão confirmada). Passo 4: Se a qualidade se mantiver ou melhorar, confirmar com uma mensagem convencional.

Para configurar o Promptfoo para o loop local: instalar com `npm install -g promptfoo`, criar um `promptfooconfig.yaml` na raiz do projeto com 3 casos de teste e um avaliador LLM-as-judge. Executar `promptfoo eval`. O tempo total de configuração é menos de 15 minutos para um prompt existente.

⚠️ A comparação com a linha de base não é opcional

Sem comparar com uma linha de base, um prompt que se degrada em casos limite pode continuar "passando" nos testes se o limite absoluto for suficientemente baixo. Sempre compare com a última versão implantada.

Armazenar prompts em controle de versões

Armazene os prompts como arquivos `.txt` ou `.ts` em um diretório `/prompts` na raiz do repositório. Versionar os prompts no Git dá a você os mesmos benefícios de versionar código: histórico completo, blame, rollback e revisão baseada em PR.

Convenção de nomes: `tarefa-versão.txt` — por exemplo, `customer-support-v3.txt`, `email-draft-v1.txt`. Use números de versão sequenciais, não datas. Quando um prompt é retirado, mova-o para `/prompts/archive/` em vez de excluí-lo.

Formato de mensagem de confirmação para mudanças de prompt: use commits convencionais — `feat: add few-shot examples to customer-support prompt`, `fix: reduce hallucination in email-draft prompt`. Tag Git para versões em produção: após cada implantação bem-sucedida em produção, faça o tag do commit com `prompts/tarefa/versão`.

📌 Os prompts são código

Trate os arquivos de prompt com a mesma disciplina que os arquivos de código: revisão por PR, autores nomeados, versionamento semântico e nunca exclua — mova para /prompts/archive/ em vez disso.

Gates CI/CD para prompts

Adicione um fluxo do GitHub Actions que execute o Promptfoo ou o Braintrust em cada pull request e falhe o build se a taxa de aprovação cair abaixo de um limite. Comece o limite em 85% e aumente para 95% após 3 meses de testes estáveis.

Estrutura do fluxo do GitHub Actions: crie `.github/workflows/prompt-test.yml` com um job que seja ativado em `pull_request`, instale o Promptfoo, execute `promptfoo eval --config promptfooconfig.yaml` e falhe se o código de saída for diferente de zero.

Estratégia de limite: comece em 85% para permitir alguma variância enquanto detecta regressões importantes. Após 3 meses de testes estáveis sem falsos falhos, suba para 95%. Adicione o job prompt-test como verificação de status obrigatória na configuração de proteção de branches do repositório.

Monitoramento em produção para prompts

Registre as entradas e saídas dos prompts, execute um pontuador de qualidade em cada resposta e configure alertas para quedas de pontuação de qualidade superiores a 10% em uma janela deslizante de 24 horas. Monitore todos os prompts que gerenciam dados do usuário.

O que registrar: identificador e versão do prompt, nome do modelo, contagem de tokens de entrada, contagem de tokens de saída, latência em milissegundos e uma pontuação de qualidade de um avaliador. Para prompts que gerenciam dados pessoais, registre um hash da entrada em vez da entrada bruta para evitar armazenar PII nos registros.

Opções de pontuação de qualidade: o Braintrust fornece um avaliador baseado na nuvem com pontuação por resposta e painéis. Para uma abordagem auto-hospedada, execute uma chamada leve de LLM-as-judge em uma amostra de 10% das respostas. Acione um alerta se a pontuação média de qualidade cair mais de 10% em comparação com a média deslizante de 7 dias.

Erros comuns em fluxos de trabalho de prompts para desenvolvedores

Escrever prompts diretamente no código da aplicação

Why it hurts: Os prompts codificados não podem ser versionados, testados nem alterados sem uma implantação completa

Fix: Armazene os prompts como arquivos separados em um diretório /prompts. Carregue-os em tempo de execução.

Testar apenas localmente, nunca em CI/CD

Why it hurts: Os testes locais são pulados sob pressão de tempo; os gates CI/CD são obrigatórios

Fix: Adicione uma etapa de teste com Promptfoo ao GitHub Actions. Bloqueie o merge se a taxa de aprovação cair abaixo de 85%.

Sem monitoramento em produção

Why it hurts: A qualidade dos prompts se degrada após a implantação sem visibilidade

Fix: Registre a taxa de aprovação por prompt por dia. Alerte se a taxa de aprovação cair 5% semana a semana.

Testar com um único modelo

Why it hurts: Um prompt que funciona no GPT-5.5 pode falhar no Claude 4.6 Sonnet

Fix: Execute sua suite de testes em pelo menos 2 modelos em CI/CD.

Pontos-chave

  • Use Cursor para TypeScript/Python com APIs na nuvem. Use VS Code + Continue.dev para modelos locais ou requisitos de código aberto.
  • O loop de teste local tem 4 passos: escrever, testar em 3 entradas representativas, comparar com a linha de base, confirmar se passa. Objetivo: menos de 30 segundos com Promptfoo.
  • Armazene os prompts como arquivos .txt ou .ts em /prompts. Convenção de nomes tarefa-versão.txt. Faça o tag das versões implantadas em produção no Git.
  • Adicione um gate CI/CD com GitHub Actions que falhe o build se a taxa de aprovação cair abaixo de 85%. Suba para 95% após 3 meses de testes estáveis.
  • Em produção, registre o identificador do prompt, o modelo, a contagem de tokens, a latência e a pontuação de qualidade. Alerte sobre quedas de pontuação de qualidade superiores a 10% em 24 horas.

Perguntas frequentes

Qual IDE é melhor para o prompt engineering?

O Cursor é o IDE recomendado para desenvolvedores que trabalham principalmente em TypeScript ou Python e querem integração nativa de IA. O VS Code com Continue.dev é recomendado se você precisar de suporte de modelos locais ou requisitos de código aberto.

Como você deve armazenar os prompts no controle de versões?

Armazene os prompts como arquivos .txt ou .ts em um diretório /prompts. Convenção de nomes: tarefa-versão.txt. Use o formato de commits convencionais para mudanças de prompts. Adicione tags Git para cada versão implantada em produção.

Como você configura um gate CI/CD para prompts?

Adicione uma etapa de fluxo do GitHub Actions que execute o Promptfoo em cada pull request. Falhe o build se a taxa de aprovação cair abaixo do limite — comece em 85% e suba para 95% após 3 meses de testes estáveis.

O que você deve registrar para o monitoramento de prompts em produção?

Registre as entradas do prompt (ou um hash se contiverem PII), respostas do modelo, latência, contagem de tokens e pontuação de qualidade de um avaliador. Mantenha os registros por pelo menos 30 dias.

Como armazeno os prompts em um repositório Git?

Armazene cada prompt como um arquivo de texto simples em `/prompts/tema/`. Nomeie os arquivos com slug e versão: `classify-intent-v2.txt`. Adicione YAML frontmatter com: versão, autor, data, modelo e descrição.

O que é um gate CI/CD para prompts?

Um gate CI/CD é uma etapa de teste automatizado que executa sua suite de testes de prompts em cada PR e bloqueia o merge se a taxa de aprovação cair abaixo do seu limite (tipicamente 85%). Implemente-o no GitHub Actions usando a CLI do Promptfoo: `npx promptfoo eval --threshold 0.85`.

Qual IDE é melhor para o prompt engineering?

O Cursor é o melhor IDE para o prompt engineering porque permite executar Claude 4.6 Sonnet diretamente sobre arquivos de prompt a partir do editor. O VS Code com Continue.dev é uma boa alternativa para equipes que precisam de ferramentas de código aberto.

Aplique estas técnicas em mais de 25 modelos de IA simultaneamente com PromptQuorum.

Experimente o PromptQuorum grátis →

← Voltar para Prompt Engineering

Prompt engineering para desenvolvedores: IDE e CI/CD