Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/Melhor configuração de LLM local para dados sensíveis
Privacy & Business

Melhor configuração de LLM local para dados sensíveis

·12 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

Os LLMs locais garantem zero saída de dados: prontuários médicos, documentos financeiros e peças jurídicas nunca saem da sua máquina.

Os LLMs locais garantem zero saída de dados: prontuários médicos, documentos financeiros e peças jurídicas nunca saem da sua máquina. Desde abril de 2026, os setores sob regulação estrita (saúde HIPAA, finanças PCI-DSS, sigilo advogado-cliente jurídico) exigem inferência air-gapped. Este guia cobre a configuração segura, o registro de auditoria e a verificação de conformidade.

Key Takeaways

  • HIPAA (saúde): Os dados de pacientes não podem chegar a APIs em nuvem. LLM local em rede isolada, armazenamento criptografado, registros de acesso.
  • PCI-DSS (cartões de pagamento): Os dados de cartão não podem ser processados por LLMs de forma alguma. Use-os só para análise, nunca com o número completo (PAN).
  • Jurídico (sigilo advogado-cliente): Os documentos privilegiados não podem sair do controle do advogado. Máquina air-gapped, sem rede, só saída em papel.
  • Configuração: Ollama ou vLLM em servidor Linux isolado, sistema de arquivos criptografado (LUKS), registro de auditoria (ELK), sem internet. Custo: US$ 3.000-5.000 de hardware + US$ 2.000/ano em atualizações.
  • UE/GDPR e Brasil/LGPD: Artigo 32 (Segurança), Artigo 35 (DPIA obrigatória), AI Act 2024/1689 (avaliação de riscos); a LGPD (Lei nº 13.709/2018) impõe princípios equivalentes. Residência de dados = apenas armazenamento local.
  • vs APIs em nuvem: Nuvem = o provedor controla os dados + responsabilidade por violações. Local = você controla + risco zero de violações.

Por que LLMs locais para conformidade?

As APIs em nuvem (ChatGPT, Claude, Gemini) não podem ser usadas com dados regulados:

  • A transmissão de dados para a nuvem = violação de confidencialidade (HIPAA, sigilo jurídico).
  • Não existe opção de "modo privado". Os dados acabam treinando modelos (os termos do provedor permitem).
  • Dependência do provedor: se o provedor sofrer uma violação ou fechar, você perde dados e o status de conformidade.

Os LLMs locais garantem:

  • Zero saída de dados (air-gapped = sem rede, sem nuvem).
  • Trilha de auditoria (cada acesso é registrado, assinado criptograficamente, imutável).
  • Controle total (você é o dono dos dados, das chaves de criptografia e de todo o stack).
  • Custos previsíveis (sem cobranças por token após o investimento inicial de US$ 5.000 em hardware).

Configuração compatível com HIPAA (Saúde)

A PHI (Informação de Saúde Protegida) não pode ser processada por sistemas não confiáveis. A HIPAA exige criptografia, controles de acesso e registro de auditoria (45 CFR 164.312).

  1. 1
    Isolar o servidor: Máquina Linux dedicada (sem recursos compartilhados), sem internet, USB criptografado para transferência de dados de entrada/saída.
  2. 2
    Criptografar o armazenamento: Criptografia de disco completo LUKS, AES-256, protegida com frase secreta. Evita o vazamento de dados se o hardware for roubado.
  3. 3
    Isolamento de rede: VLAN dedicada ou air-gapped (sem rede). Acesso via VPN com MFA, ou apenas terminal físico.
  4. 4
    Registro de auditoria: Cada consulta ao LLM é registrada: carimbo de data/hora, ID de usuário, hash do documento (não o texto puro), comprimento da resposta, modelo usado. Logs armazenados em servidor syslog criptografado separado.
  5. 5
    Controle de acesso: Baseado em papéis (médico vs. administrador vs. pesquisador). MFA para o login. Sem senhas compartilhadas. Desativar a conta ao encerrar o vínculo de trabalho.
  6. 6
    Política de retenção: Excluir os registros de inferência após 6 anos (requisito HIPAA: 45 CFR 164.312). Scripts de purga automatizados com verificação criptográfica.
  7. 7
    Acordo de Parceiro Comercial (BAA): Só se aplica a provedores. Os modelos de código aberto (Llama, Mistral) exigem documentação interna de conformidade, não assinaturas de provedor.
  8. 8
    Teste de penetração anual: Auditoria de segurança de terceiros para verificar que não há exfiltração de dados, credenciais padrão nem vulnerabilidades sem correção.

Configuração compatível com PCI-DSS (Finanças)

Os dados de cartões de pagamento (PAN = Número da Conta Principal) não podem ser processados por LLMs. O PCI-DSS v4.0 exige 12 requisitos fundamentais.

  1. 1
    Nunca insira números de cartão completos em um LLM. O PCI-DSS proíbe isso totalmente. Use representações tokenizadas (só os últimos 4 dígitos, sem data de validade).
  2. 2
    Criptografia em repouso e em trânsito: Arquivos criptografados AES-256, TLS 1.3 para a rede. Todos os dados de cartão são criptografados antes de sair do terminal.
  3. 3
    Segmentação de rede: Servidor LLM em VLAN isolada com regras de firewall. Sem acesso à internet, sem acesso à rede corporativa.
  4. 4
    Módulo de segurança de hardware (HSM): Armazena as chaves de criptografia em um dispositivo resistente a adulteração (Thales, Yubico HSM). Separado do servidor LLM.
  5. 5
    Registro e monitoramento: Alertas em tempo real sobre acesso a arquivos, tentativas de login, autenticação falha, exfiltração de dados. Integração SIEM (Splunk, ELK).
  6. 6
    Varredura de conformidade trimestral: Varredura PCI-DSS automatizada (Qualys, Nessus, Rapid7) para detectar vulnerabilidades. Remediar em 30 dias.
  7. 7
    Documentação do provedor: Os provedores de modelos (Ollama, vLLM) não são processadores de pagamento nem provedores PCI. Sua implantação local está dentro do escopo.

Implantação air-gapped

A opção mais segura: a máquina não tem nenhuma conexão de rede (isolamento em nível de gaiola de Faraday).

  1. 1
    Isolamento físico: Servidor em sala trancada (controle de acesso físico), sem cabo Ethernet, WiFi desativado na BIOS, Bluetooth desativado.
  2. 2
    Carga do modelo: Download prévio dos modelos em uma máquina conectada (do HuggingFace), transferência via USB criptografado (criptografia GPG, AES-256).
  3. 3
    Transferência de dados de entrada: Os usuários transferem documentos via USB criptografado (criptografia GPG ou 7z). Analise o USB em busca de malware na máquina air-gapped.
  4. 4
    Inferência: Rodar o LLM localmente (Ollama, vLLM), saída salva no USB. Sem chamadas de rede, sem acesso a APIs externas.
  5. 5
    Transferência de dados de saída: O USB criptografado é devolvido ao usuário e descriptografado em uma máquina não sensível separada. O USB criptografado original é destruído após verificar a descriptografia.
  6. 6
    Compromisso: Latência (a transferência manual por USB leva minutos) vs. segurança absoluta (zero risco de rede, zero possibilidade de violação remota).
  7. 7
    Caso de uso: Discovery jurídico (revisão por advogado), análise de imagens médicas, treinamento de modelos financeiros (processamento em lote com latência de 1 hora aceitável).

Conformidade UE/GDPR/AI Act e LGPD (Brasil)

A legislação europeia de proteção de dados (GDPR, EU AI Act 2024/1689) exige avaliações explícitas de segurança e riscos. No Brasil, a LGPD (Lei nº 13.709/2018) impõe princípios equivalentes, fiscalizados pela ANPD.

  1. 1
    GDPR Artigo 32 (Segurança): Garantir criptografia adequada, pseudonimização, confidencialidade, integridade e resiliência. O LLM local cumpre isso por padrão (sem transmissão para a nuvem = sem risco). A LGPD (art. 46) impõe dever de segurança equivalente.
  2. 2
    GDPR Artigo 35 (Relatório de Impacto à Proteção de Dados): Obrigatório para o tratamento de alto risco. Documentar: tipos de dados (médicos, financeiros), retenção (6 anos), controles de acesso, cenários de violação. LLM local = baixo risco (conteúdo). A LGPD prevê o RIPD equivalente.
  3. 3
    GDPR Artigo 17 (Direito ao Esquecimento): Os registros locais devem ser excluídos mediante solicitação. Implementar scripts de anonimização automatizados (remover ID de usuário, fazer hash de documentos). A LGPD prevê o direito de eliminação (art. 18).
  4. 4
    EU AI Act 2024/1689 (Sistemas de Alto Risco): A classificação depende do caso de uso. Diagnóstico médico = alto risco (exige explicabilidade). Revisão de documentos jurídicos = risco médio (exige trilha de auditoria). Implementar avaliação de riscos e processo de revisão humana.
  5. 5
    DPIA/RIPD (Relatório de Impacto à Proteção de Dados): Obrigatório antes da implantação. Documentar: finalidade do tratamento (diagnóstico, revisão de casos), categorias de dados (prontuários, contratos), terceiros (nenhum), retenção (6 anos), salvaguardas (criptografia, registros de acesso).
  6. 6
    BDSG alemão (Bundesdatenschutzgesetz): Amplia o GDPR com requisitos adicionais: o provedor do sistema deve ser alemão/UE (implantação local = conforme), contratos de tratamento de dados obrigatórios (autotratamento = conforme).

Modelos recomendados e dimensionamento de hardware

Escolha os modelos conforme os requisitos de conformidade e o tamanho da infraestrutura.

Caso de usoModeloVRAMHardwarePor quê
Revisão de documentos (Jurídico)LLaMA 4 Scout (7B)8-12 GBRTX 4060 / M4 MaxRaciocínio jurídico rápido e preciso, pegada reduzida
Prontuário médico (HIPAA)Mistral Large (34B)32-40 GBRTX 4090 / A100 (40 GB)Alta precisão, conhecimento médico, cumpre os requisitos HIPAA
Análise financeira (PCI)Llama 3.3 70B70-80 GBA100 (80 GB) / H100Raciocínio financeiro, trilhas de auditoria de conformidade
Equipes pequenas (<10)Mistral Small Instruct8-16 GBM3/M4 Pro ou RTX 4070Custo-benefício, suficiente para gestão básica de documentos

Comparativo LLM local vs API em nuvem

Comparação direta de modelos de implantação. (Hardware no varejo brasileiro fica ~2-3x mais caro em reais por causa dos impostos de importação.)

FatorLLM localAPI em nuvem
Segurança de dadosZero saída. Os dados permanecem on-premise. Criptografados em repouso e em trânsito.Dados enviados aos servidores do provedor. O provedor pode treinar com eles (ToS permite). A responsabilidade por violação recai sobre o provedor.
ConformidadeCompatível com HIPAA/PCI/GDPR/LGPD. Registros de auditoria sob o seu controle. DPIA exigida, mas de baixo risco.Não cumpre as regulações. O provedor é o operador de dados, você é o controlador.
CustoUS$ 3.000-5.000 de hardware inicial. US$ 0-500/ano de manutenção. Previsível.US$ 0 inicial. US$ 500.000+/ano em escala (tokens × preços 2026). Imprevisível.
Responsabilidade por violaçãoUS$ 0 (os dados nunca saem do seu controle). Seguro não é necessário.US$ 50.000-5.000.000+ (violação do provedor = você é responsável perante os afetados sob HIPAA/GDPR/LGPD).

Registro de auditoria e governança de dados

O que registrar: Cada consulta ao LLM (carimbo de data/hora, usuário, hash do prompt, comprimento da resposta, versão do modelo), acesso a arquivos (abrir/ler/modificar), login/logout (IP, status de MFA).

Onde armazenar: Servidor syslog criptografado, máquina física separada do servidor LLM. Evita que uma violação de dados comprometa os registros.

Resistência a adulteração: Assinaturas criptográficas nos registros (SHA-256, assinado com chave de administrador). Sem exclusão sem quebrar a cadeia de confiança. Implementar armazenamento de apenas-adição.

Ferramentas: ELK Stack (Elasticsearch/Logstash/Kibana) para agregação e busca; Splunk para empresas (retenção padrão de 60 dias).

Política de retenção: HIPAA = 6 anos, GDPR = direito ao esquecimento (anonimizar após 6 meses), PCI-DSS = 1 ano. Automatizar a purga com verificação criptográfica.

Verificação mensal de conformidade: Revisão de registros (verificação aleatória de 5% dos logs). Auditoria trimestral da linhagem de dados (rastrear consultas até a origem). Avaliação anual de terceiros (teste de penetração, verificação de registros).

Falhas de conformidade mais comuns

  • Usar o ChatGPT na nuvem com dados de saúde. Violação imediata da HIPAA. Multa: US$ 10.000-50.000 por incidente (até US$ 1.500.000 por ano). Exemplo: equipe hospitalar usando o ChatGPT para redigir sumários de alta (PHI exposta).
  • Servidor air-gapped com porta sem tranca. A segurança física = zero se qualquer um pode entrar. Exemplo: um auditor de conformidade encontrou o servidor LLM em uma sala de servidores de acesso público sem controle de acesso por credencial.
  • Registros armazenados no mesmo servidor que os dados. Violação nos registros = violação na trilha de auditoria. São exigidos sistemas separados (45 CFR 164.312(b)). Exemplo: ransomware criptografou tanto os dados quanto os registros, destruindo a trilha de auditoria.
  • Sem criptografia de dados em trânsito. Transferências USB sem criptografia em rede compartilhada. Um ataque de sniffing captura prontuários médicos. Use arquivos criptografados com GPG e verifique os checksums.
  • BAA com modelos de código aberto. Os modelos de código aberto (Llama, Mistral) não têm provedor para assinar um BAA. Em vez disso, documente sua conformidade internamente (registros de auditoria, avaliação de riscos, DPIA). O BAA só se aplica a provedores.
  • Sem política de retenção. A HIPAA exige purgar após 6 anos. Não excluir = violação. Implemente scripts automatizados que excluam os registros conforme um calendário com prova criptográfica.

Perguntas frequentes

Posso usar LLMs na nuvem com dados de conformidade se eu fizer hash da PII?

Não. Os dados com hash continuam sendo regulados. HIPAA/GDPR/LGPD proíbem a transmissão a qualquer provedor, incluindo APIs em nuvem. O hash não remove os dados do controle do provedor. Use apenas LLM local.

Preciso de um BAA com os modelos Llama ou Mistral?

Não. Os modelos de código aberto não têm provedor para assinar um BAA. Em vez disso, documente sua conformidade internamente: avaliação de riscos, procedimentos de tratamento de dados, registros de auditoria, política de retenção. O BAA só é obrigatório se você usar um provedor (OpenAI, Anthropic, Google).

A implantação air-gapped é exagero para a HIPAA?

Não é exagero se os dados forem muito sensíveis (genética, registros psiquiátricos). Melhor prática segundo a Regra Ômnibus da HIPAA (2013). Para dados menos sensíveis (consultas básicas), uma implantação local protegida por VPN é aceitável com auditorias mensais.

Como gerencio com segurança o desligamento de um funcionário?

Desativar imediatamente o acesso VPN. Auditar todas as consultas ao LLM desse usuário nos últimos 6 meses (requisito de conformidade). Verificar que nenhum dado confidencial foi exportado. Arquivar os registros (somente leitura) por 6 anos (retenção HIPAA). Remover o usuário das listas de controle de acesso.

Posso usar LLMs locais para discovery jurídico?

Sim. Air-gapped + supervisão do advogado mantém o sigilo advogado-cliente (sem acesso de terceiros). Documentar: cadeia de custódia, procedimentos de tratamento de dados, registros de acesso. Cumpre os requisitos de discovery eletrônico (FRCP 34).

O que acontece se houver uma violação no servidor local?

Criptografia em repouso = dano limitado (o atacante não consegue ler os dados). Os registros de auditoria revelam o que foi acessado (só as consultas comprometidas). Notificar as partes afetadas em 30 dias (requisito HIPAA/GDPR/LGPD). Resposta ao incidente: isolar o servidor, análise forense, atualizar senhas, teste de penetração.

A inferência local é mais lenta que as APIs em nuvem?

A latência é um pouco maior (200 ms local vs. 50 ms na nuvem), mas a vazão é comparável. O processamento em lote (revisão jurídica, análise de imagens médicas) não mostra diferença prática. O chat em tempo real é aceitável para a maioria dos casos de uso.

Posso armazenar as saídas do LLM local na nuvem após a inferência?

Só se estiver criptografado de ponta a ponta (você possui a chave de criptografia, o provedor de nuvem não consegue acessar o texto puro). Recomendado: armazenar localmente e fazer backups em armazenamento criptografado na nuvem (AWS S3 com criptografia do lado do servidor). Cumprir os requisitos de residência de dados (UE = os dados permanecem na UE).

Fontes

  • Regra de Privacidade HIPAA: 45 CFR 164.300-318 (Departamento de Saúde e Serviços Humanos dos EUA, 2013)
  • Regra de Segurança HIPAA: 45 CFR 164.300-318 (Criptografia, controles de acesso, registro de auditoria)
  • Padrão de Segurança de Dados PCI v4.0 (PCI Security Standards Council, 2022) — Gestão de dados de cartões de pagamento
  • GDPR Artigos 32, 35, 17 (Regulamento Geral de Proteção de Dados, UE, 2016) — Segurança, DPIA, direito ao esquecimento
  • LGPD — Lei nº 13.709/2018 (Brasil) — Princípios de segurança, RIPD e direitos do titular, fiscalizados pela ANPD
  • EU AI Act 2024/1689 (União Europeia, 2024) — Governança de sistemas de IA de alto risco
  • BDSG alemão (Bundesdatenschutzgesetz, 2018) — Requisitos de residência e tratamento de dados

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

LLM local para dados sensíveis 2026: guia HIPAA e PCI-DSS