Key Takeaways
- HIPAA (saúde): Os dados de pacientes não podem chegar a APIs em nuvem. LLM local em rede isolada, armazenamento criptografado, registros de acesso.
- PCI-DSS (cartões de pagamento): Os dados de cartão não podem ser processados por LLMs de forma alguma. Use-os só para análise, nunca com o número completo (PAN).
- Jurídico (sigilo advogado-cliente): Os documentos privilegiados não podem sair do controle do advogado. Máquina air-gapped, sem rede, só saída em papel.
- Configuração: Ollama ou vLLM em servidor Linux isolado, sistema de arquivos criptografado (LUKS), registro de auditoria (ELK), sem internet. Custo: US$ 3.000-5.000 de hardware + US$ 2.000/ano em atualizações.
- UE/GDPR e Brasil/LGPD: Artigo 32 (Segurança), Artigo 35 (DPIA obrigatória), AI Act 2024/1689 (avaliação de riscos); a LGPD (Lei nº 13.709/2018) impõe princípios equivalentes. Residência de dados = apenas armazenamento local.
- vs APIs em nuvem: Nuvem = o provedor controla os dados + responsabilidade por violações. Local = você controla + risco zero de violações.
Por que LLMs locais para conformidade?
As APIs em nuvem (ChatGPT, Claude, Gemini) não podem ser usadas com dados regulados:
- A transmissão de dados para a nuvem = violação de confidencialidade (HIPAA, sigilo jurídico).
- Não existe opção de "modo privado". Os dados acabam treinando modelos (os termos do provedor permitem).
- Dependência do provedor: se o provedor sofrer uma violação ou fechar, você perde dados e o status de conformidade.
Os LLMs locais garantem:
- Zero saída de dados (air-gapped = sem rede, sem nuvem).
- Trilha de auditoria (cada acesso é registrado, assinado criptograficamente, imutável).
- Controle total (você é o dono dos dados, das chaves de criptografia e de todo o stack).
- Custos previsíveis (sem cobranças por token após o investimento inicial de US$ 5.000 em hardware).
Configuração compatível com HIPAA (Saúde)
A PHI (Informação de Saúde Protegida) não pode ser processada por sistemas não confiáveis. A HIPAA exige criptografia, controles de acesso e registro de auditoria (45 CFR 164.312).
- 1Isolar o servidor: Máquina Linux dedicada (sem recursos compartilhados), sem internet, USB criptografado para transferência de dados de entrada/saída.
- 2Criptografar o armazenamento: Criptografia de disco completo LUKS, AES-256, protegida com frase secreta. Evita o vazamento de dados se o hardware for roubado.
- 3Isolamento de rede: VLAN dedicada ou air-gapped (sem rede). Acesso via VPN com MFA, ou apenas terminal físico.
- 4Registro de auditoria: Cada consulta ao LLM é registrada: carimbo de data/hora, ID de usuário, hash do documento (não o texto puro), comprimento da resposta, modelo usado. Logs armazenados em servidor syslog criptografado separado.
- 5Controle de acesso: Baseado em papéis (médico vs. administrador vs. pesquisador). MFA para o login. Sem senhas compartilhadas. Desativar a conta ao encerrar o vínculo de trabalho.
- 6Política de retenção: Excluir os registros de inferência após 6 anos (requisito HIPAA: 45 CFR 164.312). Scripts de purga automatizados com verificação criptográfica.
- 7Acordo de Parceiro Comercial (BAA): Só se aplica a provedores. Os modelos de código aberto (Llama, Mistral) exigem documentação interna de conformidade, não assinaturas de provedor.
- 8Teste de penetração anual: Auditoria de segurança de terceiros para verificar que não há exfiltração de dados, credenciais padrão nem vulnerabilidades sem correção.
Configuração compatível com PCI-DSS (Finanças)
Os dados de cartões de pagamento (PAN = Número da Conta Principal) não podem ser processados por LLMs. O PCI-DSS v4.0 exige 12 requisitos fundamentais.
- 1Nunca insira números de cartão completos em um LLM. O PCI-DSS proíbe isso totalmente. Use representações tokenizadas (só os últimos 4 dígitos, sem data de validade).
- 2Criptografia em repouso e em trânsito: Arquivos criptografados AES-256, TLS 1.3 para a rede. Todos os dados de cartão são criptografados antes de sair do terminal.
- 3Segmentação de rede: Servidor LLM em VLAN isolada com regras de firewall. Sem acesso à internet, sem acesso à rede corporativa.
- 4Módulo de segurança de hardware (HSM): Armazena as chaves de criptografia em um dispositivo resistente a adulteração (Thales, Yubico HSM). Separado do servidor LLM.
- 5Registro e monitoramento: Alertas em tempo real sobre acesso a arquivos, tentativas de login, autenticação falha, exfiltração de dados. Integração SIEM (Splunk, ELK).
- 6Varredura de conformidade trimestral: Varredura PCI-DSS automatizada (Qualys, Nessus, Rapid7) para detectar vulnerabilidades. Remediar em 30 dias.
- 7Documentação do provedor: Os provedores de modelos (Ollama, vLLM) não são processadores de pagamento nem provedores PCI. Sua implantação local está dentro do escopo.
Implantação air-gapped
A opção mais segura: a máquina não tem nenhuma conexão de rede (isolamento em nível de gaiola de Faraday).
- 1Isolamento físico: Servidor em sala trancada (controle de acesso físico), sem cabo Ethernet, WiFi desativado na BIOS, Bluetooth desativado.
- 2Carga do modelo: Download prévio dos modelos em uma máquina conectada (do HuggingFace), transferência via USB criptografado (criptografia GPG, AES-256).
- 3Transferência de dados de entrada: Os usuários transferem documentos via USB criptografado (criptografia GPG ou 7z). Analise o USB em busca de malware na máquina air-gapped.
- 4Inferência: Rodar o LLM localmente (Ollama, vLLM), saída salva no USB. Sem chamadas de rede, sem acesso a APIs externas.
- 5Transferência de dados de saída: O USB criptografado é devolvido ao usuário e descriptografado em uma máquina não sensível separada. O USB criptografado original é destruído após verificar a descriptografia.
- 6Compromisso: Latência (a transferência manual por USB leva minutos) vs. segurança absoluta (zero risco de rede, zero possibilidade de violação remota).
- 7Caso de uso: Discovery jurídico (revisão por advogado), análise de imagens médicas, treinamento de modelos financeiros (processamento em lote com latência de 1 hora aceitável).
Conformidade UE/GDPR/AI Act e LGPD (Brasil)
A legislação europeia de proteção de dados (GDPR, EU AI Act 2024/1689) exige avaliações explícitas de segurança e riscos. No Brasil, a LGPD (Lei nº 13.709/2018) impõe princípios equivalentes, fiscalizados pela ANPD.
- 1GDPR Artigo 32 (Segurança): Garantir criptografia adequada, pseudonimização, confidencialidade, integridade e resiliência. O LLM local cumpre isso por padrão (sem transmissão para a nuvem = sem risco). A LGPD (art. 46) impõe dever de segurança equivalente.
- 2GDPR Artigo 35 (Relatório de Impacto à Proteção de Dados): Obrigatório para o tratamento de alto risco. Documentar: tipos de dados (médicos, financeiros), retenção (6 anos), controles de acesso, cenários de violação. LLM local = baixo risco (conteúdo). A LGPD prevê o RIPD equivalente.
- 3GDPR Artigo 17 (Direito ao Esquecimento): Os registros locais devem ser excluídos mediante solicitação. Implementar scripts de anonimização automatizados (remover ID de usuário, fazer hash de documentos). A LGPD prevê o direito de eliminação (art. 18).
- 4EU AI Act 2024/1689 (Sistemas de Alto Risco): A classificação depende do caso de uso. Diagnóstico médico = alto risco (exige explicabilidade). Revisão de documentos jurídicos = risco médio (exige trilha de auditoria). Implementar avaliação de riscos e processo de revisão humana.
- 5DPIA/RIPD (Relatório de Impacto à Proteção de Dados): Obrigatório antes da implantação. Documentar: finalidade do tratamento (diagnóstico, revisão de casos), categorias de dados (prontuários, contratos), terceiros (nenhum), retenção (6 anos), salvaguardas (criptografia, registros de acesso).
- 6BDSG alemão (Bundesdatenschutzgesetz): Amplia o GDPR com requisitos adicionais: o provedor do sistema deve ser alemão/UE (implantação local = conforme), contratos de tratamento de dados obrigatórios (autotratamento = conforme).
Modelos recomendados e dimensionamento de hardware
Escolha os modelos conforme os requisitos de conformidade e o tamanho da infraestrutura.
| Caso de uso | Modelo | VRAM | Hardware | Por quê |
|---|---|---|---|---|
| Revisão de documentos (Jurídico) | LLaMA 4 Scout (7B) | 8-12 GB | RTX 4060 / M4 Max | Raciocínio jurídico rápido e preciso, pegada reduzida |
| Prontuário médico (HIPAA) | Mistral Large (34B) | 32-40 GB | RTX 4090 / A100 (40 GB) | Alta precisão, conhecimento médico, cumpre os requisitos HIPAA |
| Análise financeira (PCI) | Llama 3.3 70B | 70-80 GB | A100 (80 GB) / H100 | Raciocínio financeiro, trilhas de auditoria de conformidade |
| Equipes pequenas (<10) | Mistral Small Instruct | 8-16 GB | M3/M4 Pro ou RTX 4070 | Custo-benefício, suficiente para gestão básica de documentos |
Comparativo LLM local vs API em nuvem
Comparação direta de modelos de implantação. (Hardware no varejo brasileiro fica ~2-3x mais caro em reais por causa dos impostos de importação.)
| Fator | LLM local | API em nuvem |
|---|---|---|
| Segurança de dados | Zero saída. Os dados permanecem on-premise. Criptografados em repouso e em trânsito. | Dados enviados aos servidores do provedor. O provedor pode treinar com eles (ToS permite). A responsabilidade por violação recai sobre o provedor. |
| Conformidade | Compatível com HIPAA/PCI/GDPR/LGPD. Registros de auditoria sob o seu controle. DPIA exigida, mas de baixo risco. | Não cumpre as regulações. O provedor é o operador de dados, você é o controlador. |
| Custo | US$ 3.000-5.000 de hardware inicial. US$ 0-500/ano de manutenção. Previsível. | US$ 0 inicial. US$ 500.000+/ano em escala (tokens × preços 2026). Imprevisível. |
| Responsabilidade por violação | US$ 0 (os dados nunca saem do seu controle). Seguro não é necessário. | US$ 50.000-5.000.000+ (violação do provedor = você é responsável perante os afetados sob HIPAA/GDPR/LGPD). |
Registro de auditoria e governança de dados
O que registrar: Cada consulta ao LLM (carimbo de data/hora, usuário, hash do prompt, comprimento da resposta, versão do modelo), acesso a arquivos (abrir/ler/modificar), login/logout (IP, status de MFA).
Onde armazenar: Servidor syslog criptografado, máquina física separada do servidor LLM. Evita que uma violação de dados comprometa os registros.
Resistência a adulteração: Assinaturas criptográficas nos registros (SHA-256, assinado com chave de administrador). Sem exclusão sem quebrar a cadeia de confiança. Implementar armazenamento de apenas-adição.
Ferramentas: ELK Stack (Elasticsearch/Logstash/Kibana) para agregação e busca; Splunk para empresas (retenção padrão de 60 dias).
Política de retenção: HIPAA = 6 anos, GDPR = direito ao esquecimento (anonimizar após 6 meses), PCI-DSS = 1 ano. Automatizar a purga com verificação criptográfica.
Verificação mensal de conformidade: Revisão de registros (verificação aleatória de 5% dos logs). Auditoria trimestral da linhagem de dados (rastrear consultas até a origem). Avaliação anual de terceiros (teste de penetração, verificação de registros).
Falhas de conformidade mais comuns
- Usar o ChatGPT na nuvem com dados de saúde. Violação imediata da HIPAA. Multa: US$ 10.000-50.000 por incidente (até US$ 1.500.000 por ano). Exemplo: equipe hospitalar usando o ChatGPT para redigir sumários de alta (PHI exposta).
- Servidor air-gapped com porta sem tranca. A segurança física = zero se qualquer um pode entrar. Exemplo: um auditor de conformidade encontrou o servidor LLM em uma sala de servidores de acesso público sem controle de acesso por credencial.
- Registros armazenados no mesmo servidor que os dados. Violação nos registros = violação na trilha de auditoria. São exigidos sistemas separados (45 CFR 164.312(b)). Exemplo: ransomware criptografou tanto os dados quanto os registros, destruindo a trilha de auditoria.
- Sem criptografia de dados em trânsito. Transferências USB sem criptografia em rede compartilhada. Um ataque de sniffing captura prontuários médicos. Use arquivos criptografados com GPG e verifique os checksums.
- BAA com modelos de código aberto. Os modelos de código aberto (Llama, Mistral) não têm provedor para assinar um BAA. Em vez disso, documente sua conformidade internamente (registros de auditoria, avaliação de riscos, DPIA). O BAA só se aplica a provedores.
- Sem política de retenção. A HIPAA exige purgar após 6 anos. Não excluir = violação. Implemente scripts automatizados que excluam os registros conforme um calendário com prova criptográfica.
Perguntas frequentes
Posso usar LLMs na nuvem com dados de conformidade se eu fizer hash da PII?
Não. Os dados com hash continuam sendo regulados. HIPAA/GDPR/LGPD proíbem a transmissão a qualquer provedor, incluindo APIs em nuvem. O hash não remove os dados do controle do provedor. Use apenas LLM local.
Preciso de um BAA com os modelos Llama ou Mistral?
Não. Os modelos de código aberto não têm provedor para assinar um BAA. Em vez disso, documente sua conformidade internamente: avaliação de riscos, procedimentos de tratamento de dados, registros de auditoria, política de retenção. O BAA só é obrigatório se você usar um provedor (OpenAI, Anthropic, Google).
A implantação air-gapped é exagero para a HIPAA?
Não é exagero se os dados forem muito sensíveis (genética, registros psiquiátricos). Melhor prática segundo a Regra Ômnibus da HIPAA (2013). Para dados menos sensíveis (consultas básicas), uma implantação local protegida por VPN é aceitável com auditorias mensais.
Como gerencio com segurança o desligamento de um funcionário?
Desativar imediatamente o acesso VPN. Auditar todas as consultas ao LLM desse usuário nos últimos 6 meses (requisito de conformidade). Verificar que nenhum dado confidencial foi exportado. Arquivar os registros (somente leitura) por 6 anos (retenção HIPAA). Remover o usuário das listas de controle de acesso.
Posso usar LLMs locais para discovery jurídico?
Sim. Air-gapped + supervisão do advogado mantém o sigilo advogado-cliente (sem acesso de terceiros). Documentar: cadeia de custódia, procedimentos de tratamento de dados, registros de acesso. Cumpre os requisitos de discovery eletrônico (FRCP 34).
O que acontece se houver uma violação no servidor local?
Criptografia em repouso = dano limitado (o atacante não consegue ler os dados). Os registros de auditoria revelam o que foi acessado (só as consultas comprometidas). Notificar as partes afetadas em 30 dias (requisito HIPAA/GDPR/LGPD). Resposta ao incidente: isolar o servidor, análise forense, atualizar senhas, teste de penetração.
A inferência local é mais lenta que as APIs em nuvem?
A latência é um pouco maior (200 ms local vs. 50 ms na nuvem), mas a vazão é comparável. O processamento em lote (revisão jurídica, análise de imagens médicas) não mostra diferença prática. O chat em tempo real é aceitável para a maioria dos casos de uso.
Posso armazenar as saídas do LLM local na nuvem após a inferência?
Só se estiver criptografado de ponta a ponta (você possui a chave de criptografia, o provedor de nuvem não consegue acessar o texto puro). Recomendado: armazenar localmente e fazer backups em armazenamento criptografado na nuvem (AWS S3 com criptografia do lado do servidor). Cumprir os requisitos de residência de dados (UE = os dados permanecem na UE).
Leituras relacionadas
Fontes
- Regra de Privacidade HIPAA: 45 CFR 164.300-318 (Departamento de Saúde e Serviços Humanos dos EUA, 2013)
- Regra de Segurança HIPAA: 45 CFR 164.300-318 (Criptografia, controles de acesso, registro de auditoria)
- Padrão de Segurança de Dados PCI v4.0 (PCI Security Standards Council, 2022) — Gestão de dados de cartões de pagamento
- GDPR Artigos 32, 35, 17 (Regulamento Geral de Proteção de Dados, UE, 2016) — Segurança, DPIA, direito ao esquecimento
- LGPD — Lei nº 13.709/2018 (Brasil) — Princípios de segurança, RIPD e direitos do titular, fiscalizados pela ANPD
- EU AI Act 2024/1689 (União Europeia, 2024) — Governança de sistemas de IA de alto risco
- BDSG alemão (Bundesdatenschutzgesetz, 2018) — Requisitos de residência e tratamento de dados