Key Takeaways
- O melhor no geral: Mistral Small 3.1 24B (saída mais concisa, tom adequado). O melhor multilíngue: Qwen3 7B (francês/alemão/espanhol/japonês). O melhor para adaptação de tom: Llama 3.3 8B.
- Os modelos 70B são verbosos demais para textos curtos. Para documentos de mais de 2 páginas, o Llama 3.3 70B com 128K de contexto dá conta de propostas de várias seções de forma confiável.
- Mistral Small 3.1 e Llama 3.3 8B são ideais para e-mails, propostas e memos.
- Escrita de e-mails: Mistral Small 3.1. Proposta de negócio: Llama 3.3 8B com exemplos de tom.
- Transferência de voz da marca: Forneça 2-3 e-mails de exemplo; o modelo aprende o tom e a escolha de palavras.
- Modo edição > geração: Use o modelo para refinar rascunhos existentes (melhor controle que a geração pura).
- Velocidade: O Mistral Small 3.1 gera um e-mail de 200 palavras em 8-15 seg. O Llama 3.3 8B em 5-10 seg.
- Custo: Zero (código aberto) vs. US$ 30/mês (ChatGPT Plus) ou US$ 200/mês (empresa).
Quais modelos se destacam em tom profissional?
A escrita profissional premia a clareza e a concisão. Os modelos menores são melhores.
- Mistral Small 3.1 24B: A saída mais concisa. Produz conteúdo curto, limpo e profissional (e-mails, mensagens de Slack, memos executivos). O melhor controle de tom.
- Llama 3.3 8B: Equilibrado. Bom para conteúdo de comprimento médio (propostas, memos). Adapta-se bem a exemplos de voz da marca.
- Qwen3 7B: Excelente para escrita profissional em idiomas diferentes do inglês. Tokenização nativa para francês, alemão, espanhol, japonês e chinês. A melhor opção multilíngue.
- Para textos curtos (e-mails, memos), os modelos de 7B a 24B produzem saídas mais limpas que os de 70B. Para conteúdo extenso (propostas, relatórios de mais de 2 páginas), o Llama 3.3 70B com 128K de contexto dá conta de documentos de várias seções de forma confiável.
Tarefas de escrita e recomendações de modelos
| Tarefa | Melhor modelo | Estratégia de prompt | Qualidade de saída |
|---|---|---|---|
| Escrita de e-mail | Mistral Small 3.1 24B | "Voz ativa, máximo 150 palavras, sem jargão" | Excelente -- conciso, profissional |
| Proposta de negócio (1-3 páginas) | Llama 3.3 8B | Fornecer 2-3 propostas como referência de estilo | Boa -- adapta-se bem a exemplos de tom |
| Memo executivo | Mistral Small 3.1 24B | "Formato: Problema / Recomendação / Próximos passos" | Excelente -- saída estruturada |
| Mensagem de Slack/interna | Qwen3 7B | "Informal, mas profissional, máximo 2-3 frases" | Boa -- baixa latência em tempo real |
| E-mail empresarial em outro idioma | Qwen3 7B | "E-mail empresarial em [idioma], registro formal" | Excelente -- tokenização nativa |
| Resumo de contrato | Llama 3.3 70B | "Resuma as obrigações-chave e os pontos de risco" | A melhor -- contexto longo para documentos completos |
| Refino de rascunho existente | Qualquer modelo 7B | "Edite para mais clareza, remova jargão, voz ativa" | Excelente -- o melhor caso de uso do modo edição |
Engenharia de prompts para a voz da marca
A escrita profissional exige coerência. Ensine sua voz ao modelo.
- 1Reúna exemplos: 3-5 e-mails ou memos com a sua voz da marca. Quanto mais específicos, melhor; use e-mails reais enviados, não idealizados.
- 2Crie um template de prompt: "Você escreve assim: [EXEMPLOS]. Agora redija [TAREFA] com essa voz."
- 3Especifique restrições: "Máximo 150 palavras.", "Voz ativa.", "Sem jargão nem palavras da moda."
- 4Itere sobre os resultados: Se o primeiro rascunho ficar formal demais, refine: "Use linguagem mais simples, remova as palavras da moda, escreva como se mandasse uma mensagem a um colega."
- 5Salve os templates: Guarde os prompts por tipo de escrita (vendas, suporte, interno). Reutilize-os para manter a coerência.
Erros comuns na escrita profissional
- Usar modelos de 70B para textos curtos. Produzem saídas verbosas e com excesso de explicação. Para e-mails e memos, o Mistral Small 3.1 24B ou o Llama 3.3 8B é mais rápido e conciso.
- Não fornecer exemplos. O modelo adivinha a sua voz. Forneça sempre 2-3 e-mails ou memos reais enviados com a sua voz da marca.
- Confiar no primeiro rascunho. A escrita profissional exige 1-2 ciclos de edição. Use prompts de edição, não fluxos de trabalho só de geração.
- Não definir o comprimento de contexto para documentos longos: O Ollama usa por padrão 2048 tokens. Uma proposta de 2 páginas tem cerca de 1.500-2.000 palavras, perto ou acima desse limite. Defina no mínimo `PARAMETER num_ctx 8192` no seu Modelfile para tarefas de escrita profissional. Para revisão de contratos ou relatórios de várias páginas, use 32K de contexto.
- Usar o mesmo modelo para escrever e editar: O melhor fluxo de trabalho é em duas etapas: gere um rascunho inicial com qualquer modelo 7B (rápido), depois use o Mistral Small 3.1 24B em modo edição para refinar o tom, remover jargão e melhorar a estrutura. Usar um modelo de 70B para as duas tarefas é mais lento e produz saídas menos concisas que essa abordagem de dois modelos.
Configuração: assistente de escrita local
- 1Inicie o Ollama com o Mistral Small 3.1: `ollama run mistral-small3.1`.
- 2Instale a extensão do VS Code "Continue" ou a extensão de navegador para aplicações web.
- 3Crie um system prompt personalizado com os seus exemplos de voz da marca.
- 4Atribua um atalho de teclado (p. ex., Ctrl+K) para ativar o autocompletar.
- 5Redija o e-mail → selecione → Ctrl+K → "Refine este e-mail para [tom]" → copie o resultado.
LLMs locais para escrita profissional: contexto regional
UE / GDPR
Para profissionais da UE que redigem e-mails ou documentos com referências a clientes, funcionários ou parceiros comerciais, rodar um assistente de escrita local significa que nenhum dado pessoal —nomes, dados de contato, condições de acordos— é transmitido a serviços de IA em nuvem. O artigo 6 do GDPR exige uma base legal para o tratamento de dados pessoais; usar uma API de IA em nuvem para correspondência empresarial que inclui nomes de clientes e dados de empresa cria uma relação de tratamento de dados que exige um DPA segundo o artigo 28.
A inferência local elimina isso por completo. O Mistral Small 3.1 24B (Mistral AI, França, Apache 2.0) é o modelo da UE recomendado: origem europeia, licença limpa e forte capacidade de seguimento de instruções para escrita profissional formal em alemão, francês e inglês.
Brasil e Portugal
A escrita empresarial em português varia entre Brasil e Portugal em termos de registro formal. No Brasil, o tratamento formal (o senhor/a senhora) é usado em correspondência muito formal, enquanto "você" é o padrão na comunicação empresarial cotidiana; em Portugal, o uso de "o senhor"/"a senhora" e do tratamento por terceira pessoa é mais frequente. Para e-mails formais, adicione ao system prompt: "Escreva em português formal e profissional. Use tratamento formal quando apropriado. Tom objetivo e profissional, sem anglicismos." Tanto o Mistral Small 3.1 quanto o Qwen3 7B seguem essa instrução de forma confiável. O Qwen3 7B também lida com variantes regionais do português para comunicação interna mais informal.
Japão (METI)
A escrita empresarial japonesa tem registros de formalidade estritos (níveis de keigo: teineigo, sonkeigo, kenjōgo). Os LLMs padrão usam teineigo por padrão, mas não conseguem produzir sonkeigo nem kenjōgo de forma confiável sem instruções explícitas. Para correspondência empresarial em japonês: use o Qwen3 7B com instruções explícitas de keigo: "メールは丁寧な敬語(尊敬語と謙譲語)を使用してください". O tokenizador japonês do Qwen3 lida com o vocabulário empresarial em kanji/kana notavelmente melhor que o Llama no mesmo nível de tamanho.
Perguntas frequentes
Por que o Mistral Small 3.1 é melhor que o Llama 3.3 para e-mails?
O Mistral Small 3.1 é mais conciso. O Llama 3.3 é mais adaptável. Para pura brevidade/precisão: Mistral Small 3.1. Para ajuste de tom: Llama 3.3.
Posso usar um modelo 13B para escrita profissional?
Sim, mas não é necessário. O 7B é mais rápido e igualmente bom. O 13B é um pouco melhor para propostas longas (mais de 2 páginas).
Devo usar o modo geração ou o modo edição?
O modo edição (refinar rascunho existente) é mais seguro. O modo geração é mais rápido, mas exige mais trabalho de prompting.
Como evito soar como o ChatGPT?
Use modelos pequenos (7B-24B), forneça exemplos da sua marca, peça voz ativa + frases curtas, sem palavras de preenchimento.
Posso usar LLMs locais para e-mails confidenciais?
Sim. 100% privado. Nenhum dado sai da sua máquina. Essa é a principal vantagem frente às APIs em nuvem.
O que faço se a saída estiver formal demais?
Refine o prompt: "Remova o jargão. Use linguagem do dia a dia. Escreva como se mandasse uma mensagem a um colega."
Qual é o melhor LLM local para escrita profissional em idiomas diferentes do inglês?
O Qwen3 7B suporta 29 idiomas nativamente, incluindo francês, alemão, espanhol, japonês, chinês, coreano e árabe. Processa texto empresarial em outros idiomas com maior eficiência de tokens que o Llama ou o Mistral. Para idiomas europeus formais (alemão, francês, espanhol), o Mistral Small 3.1 24B é competitivo graças aos seus dados de treinamento da UE. Execute: `ollama run qwen2.5:7b` para idiomas asiáticos e do Oriente Médio; `ollama run mistral-small3.1` para escrita formal europeia.
Como uso um LLM local para replicar a voz da marca da minha empresa?
Forneça 3-5 exemplos de comunicações existentes no seu system prompt: "Você escreve neste estilo: [cole exemplos]. Mantenha este tom e vocabulário em todas as respostas." O modelo aprende padrões de vocabulário, preferências de comprimento de frase e nível de formalidade a partir dos exemplos. Atualize os exemplos a cada 6 meses conforme a sua voz da marca evolui.
Os LLMs locais conseguem escrever em português formal?
Sim, com instrução explícita. Adicione ao seu system prompt: "Escreva em português formal e profissional. Use tratamento formal (o senhor/a senhora) em comunicações formais quando apropriado. Tom objetivo e profissional, sem anglicismos." O Mistral Small 3.1 e o Qwen3 7B seguem essa instrução de forma confiável.
Qual modelo local é melhor para editar texto existente vs. gerar do zero?
Para edição: qualquer modelo 7B (Qwen3 7B, Llama 3.3 8B) funciona bem; editar é menos exigente que gerar. Para gerar do zero em documentos complexos (propostas, relatórios): o Mistral Small 3.1 24B produz saída mais estruturada. A abordagem em duas etapas funciona melhor: gere o rascunho com um modelo 7B (rápido), refine com o Mistral Small 3.1 em modo edição.
Fontes
- Mistral AI. (2024). "Mistral Small 3.1 Release." https://mistral.ai/news/mistral-small-3-1/ -- Especificações do modelo e benchmarks de seguimento de instruções para o Mistral Small 3.1 24B.
- Alibaba Qwen Team. (2025). "Qwen3 Technical Report." https://arxiv.org/abs/2412.15115 -- Dados de capacidade multilíngue incluindo suporte à escrita empresarial em japonês, alemão, francês e chinês.
- Meta AI. (2024). "Llama 3.3 Model Card." https://llama.meta.com/ -- Avaliação de adaptação de tom e seguimento de instruções para o Llama 3.3 8B.