Key Takeaways
- HIPAA (sanidad): Los datos de pacientes no pueden llegar a APIs en la nube. LLM local en red aislada, almacenamiento cifrado, registros de acceso.
- PCI-DSS (tarjetas de pago): Los datos de tarjetas no pueden procesarse con LLMs en absoluto. Úsalos solo para análisis, nunca con el número completo (PAN).
- Legal (privilegio abogado-cliente): Los documentos privilegiados no pueden salir del control del abogado. Máquina air-gapped, sin red, solo salida en papel.
- Configuración: Ollama o vLLM en servidor Linux aislado, sistema de archivos cifrado (LUKS), registro de auditoría (ELK), sin internet. Coste: 3.000-5.000 USD hardware + 2.000 USD/año en actualizaciones.
- EU/GDPR: Artículo 32 (Seguridad), Artículo 35 (DPIA obligatoria), AI Act 2024/1689 (evaluación de riesgos). Residencia de datos = solo almacenamiento local.
- vs APIs en la nube: Nube = el proveedor controla los datos + responsabilidad por brechas. Local = tú controlas + cero riesgo de brechas.
¿Por qué LLM locales para el cumplimiento?
Las APIs en la nube (ChatGPT, Claude, Gemini) no pueden usarse con datos regulados:
- La transmisión de datos a la nube = violación de confidencialidad (HIPAA, privilegio legal).
- No existe opción de "modo privado". Los datos acaban entrenando modelos (las condiciones del proveedor lo permiten).
- Dependencia del proveedor: si el proveedor sufre una brecha o cierra, pierdes datos y el estado de cumplimiento.
Los LLM locales garantizan:
- Cero egreso de datos (air-gapped = sin red, sin nube).
- Pista de auditoría (cada acceso queda registrado, firmado criptográficamente, inmutable).
- Control total (tú eres propietario de los datos, las claves de cifrado y todo el stack).
- Costes predecibles (sin cargos por token después de la inversión inicial de 5.000 USD en hardware).
Configuración compatible con HIPAA (Sanidad)
La PHI (Información de Salud Protegida) no puede ser procesada por sistemas no confiables. HIPAA exige cifrado, controles de acceso y registro de auditoría (45 CFR 164.312).
- 1Aislar el servidor: Máquina Linux dedicada (sin recursos compartidos), sin internet, USB cifrado para transferencia de datos de entrada/salida.
- 2Cifrar el almacenamiento: Cifrado de disco completo LUKS, AES-256, protegido con frase de contraseña. Evita la filtración de datos si el hardware es robado.
- 3Aislamiento de red: VLAN dedicada o air-gapped (sin red). Acceso mediante VPN con MFA, o solo terminal físico.
- 4Registro de auditoría: Cada consulta al LLM queda registrada: marca de tiempo, ID de usuario, hash del documento (no texto plano), longitud de respuesta, modelo utilizado. Logs almacenados en servidor syslog cifrado separado.
- 5Control de acceso: Basado en roles (médico vs. administrador vs. investigador). MFA para el inicio de sesión. Sin contraseñas compartidas. Desactivar cuenta al cesar la relación laboral.
- 6Política de retención: Eliminar los registros de inferencia tras 6 años (requisito HIPAA: 45 CFR 164.312). Scripts de purga automatizados con verificación criptográfica.
- 7Acuerdo de Socio Comercial (BAA): Solo aplica a proveedores. Los modelos de código abierto (Llama, Mistral) requieren documentación interna de cumplimiento, no firmas de proveedor.
- 8Prueba de penetración anual: Auditoría de seguridad de terceros para verificar que no hay exfiltración de datos, credenciales por defecto ni vulnerabilidades sin parchear.
Configuración compatible con PCI-DSS (Finanzas)
Los datos de tarjetas de pago (PAN = Número de Cuenta Principal) no pueden procesarse mediante LLMs. PCI-DSS v4.0 exige 12 requisitos fundamentales.
- 1Nunca introduzcas números de tarjeta completos en un LLM. PCI-DSS lo prohíbe totalmente. Usa representaciones tokenizadas (solo los últimos 4 dígitos, sin fecha de caducidad).
- 2Cifrado en reposo y en tránsito: Archivos cifrados AES-256, TLS 1.3 para la red. Todos los datos de tarjeta se cifran antes de salir del terminal.
- 3Segmentación de red: Servidor LLM en VLAN aislada con reglas de cortafuegos. Sin acceso a internet, sin acceso a la red corporativa.
- 4Módulo de seguridad de hardware (HSM): Almacena las claves de cifrado en un dispositivo resistente a manipulaciones (Thales, Yubico HSM). Separado del servidor LLM.
- 5Registro y monitorización: Alertas en tiempo real sobre acceso a archivos, intentos de inicio de sesión, autenticación fallida, exfiltración de datos. Integración SIEM (Splunk, ELK).
- 6Escaneo de cumplimiento trimestral: Escaneo PCI-DSS automatizado (Qualys, Nessus, Rapid7) para detectar vulnerabilidades. Remediar en 30 días.
- 7Documentación del proveedor: Los proveedores de modelos (Ollama, vLLM) no son procesadores de pago ni proveedores PCI. Tu despliegue local está dentro del alcance.
Despliegue air-gapped
La opción más segura: la máquina no tiene ninguna conexión de red (aislamiento a nivel de jaula de Faraday).
- 1Aislamiento físico: Servidor en sala con llave (control de acceso físico), sin cable Ethernet, WiFi desactivado en la BIOS, Bluetooth desactivado.
- 2Carga del modelo: Descarga previa de modelos en una máquina conectada (desde HuggingFace), transferencia mediante USB cifrado (cifrado GPG, AES-256).
- 3Transferencia de datos entrante: Los usuarios transfieren documentos mediante USB cifrado (cifrado GPG o 7z). Analizar el USB en busca de malware en la máquina air-gapped.
- 4Inferencia: Ejecutar el LLM localmente (Ollama, vLLM), salida guardada en el USB. Sin llamadas de red, sin acceso a API externas.
- 5Transferencia de datos saliente: El USB cifrado se devuelve al usuario y se descifra en una máquina no sensible separada. El USB cifrado original se destruye tras verificar el descifrado.
- 6Compensación: Latencia (la transferencia manual por USB tarda minutos) vs. seguridad absoluta (cero riesgo de red, cero posibilidad de brecha remota).
- 7Caso de uso: Descubrimiento legal (revisión por abogado), análisis de imágenes médicas, entrenamiento de modelos financieros (procesamiento por lotes con latencia de 1 hora aceptable).
Cumplimiento EU/GDPR/AI Act
La legislación europea de protección de datos (GDPR, EU AI Act 2024/1689) exige evaluaciones explícitas de seguridad y riesgos.
- 1GDPR Artículo 32 (Seguridad): Asegurar cifrado adecuado, seudonimización, confidencialidad, integridad y resiliencia. El LLM local cumple esto por defecto (sin transmisión a la nube = sin riesgo).
- 2GDPR Artículo 35 (Evaluación de Impacto en la Protección de Datos): Obligatorio para el procesamiento de alto riesgo. Documentar: tipos de datos (médicos, financieros), retención (6 años), controles de acceso, escenarios de brecha. LLM local = bajo riesgo (contenido).
- 3GDPR Artículo 17 (Derecho al Olvido): Los registros locales deben eliminarse a petición. Implementar scripts de anonimización automatizados (eliminar ID de usuario, hashear documentos).
- 4EU AI Act 2024/1689 (Sistemas de Alto Riesgo): La clasificación depende del caso de uso. Diagnóstico médico = alto riesgo (requiere explicabilidad). Revisión de documentos legales = riesgo medio (requiere pista de auditoría). Implementar evaluación de riesgos y proceso de revisión humana.
- 5DPIA (Evaluación de Impacto en la Protección de Datos): Obligatoria antes del despliegue. Documentar: finalidad del tratamiento (diagnóstico, revisión de casos), categorías de datos (historiales médicos, contratos), terceros (ninguno), retención (6 años), salvaguardas (cifrado, registros de acceso).
- 6BDSG alemán (Bundesdatenschutzgesetz): Amplía el GDPR con requisitos adicionales: el proveedor del sistema debe ser alemán/UE (despliegue local = conforme), contratos de tratamiento de datos obligatorios (auto-tratamiento = conforme).
Modelos recomendados y dimensionamiento de hardware
Elige los modelos según los requisitos de cumplimiento y el tamaño de la infraestructura.
| Caso de uso | Modelo | VRAM | Hardware | Por qué |
|---|---|---|---|---|
| Revisión de documentos (Legal) | LLaMA 4 Scout (7B) | 8-12 GB | RTX 4060 / M4 Max | Razonamiento legal rápido y preciso, huella reducida |
| Historial médico (HIPAA) | Mistral Large (34B) | 32-40 GB | RTX 4090 / A100 (40 GB) | Alta precisión, conocimiento médico, cumple los requisitos HIPAA |
| Análisis financiero (PCI) | Llama 3.1 70B | 70-80 GB | A100 (80 GB) / H100 | Razonamiento financiero, pistas de auditoría de cumplimiento |
| Equipos pequeños (<10) | Mistral 7B Instruct | 8-16 GB | M3/M4 Pro o RTX 4070 | Rentable, suficiente para gestión básica de documentos |
Comparativa LLM local vs API en la nube
Comparación directa de modelos de despliegue.
| Factor | LLM local | API en la nube |
|---|---|---|
| Seguridad de datos | Cero egreso. Los datos permanecen on-premise. Cifrados en reposo y en tránsito. | Datos enviados a servidores del proveedor. El proveedor puede entrenar con ellos (ToS lo permite). Responsabilidad de brecha recae en el proveedor. |
| Cumplimiento | Compatible con HIPAA/PCI/GDPR. Registros de auditoría bajo tu control. DPIA requerida pero de bajo riesgo. | No cumple las regulaciones. El proveedor es el procesador de datos, tú eres el responsable. |
| Coste | 3.000-5.000 USD de hardware inicial. 0-500 USD/año de mantenimiento. Predecible. | 0 USD inicial. 500.000 USD+/año a escala (tokens × precios 2026). Impredecible. |
| Responsabilidad por brecha | 0 USD (los datos nunca salen de tu control). No se requiere seguro. | 50.000-5.000.000 USD+ (brecha del proveedor = tú eres responsable ante los afectados según HIPAA/GDPR). |
Registro de auditoría y gobernanza de datos
Qué registrar: Cada consulta al LLM (marca de tiempo, usuario, hash del prompt, longitud de respuesta, versión del modelo), acceso a archivos (abrir/leer/modificar), inicio/cierre de sesión (IP, estado de MFA).
Dónde almacenar: Servidor syslog cifrado, máquina física separada del servidor LLM. Evita que una brecha de datos comprometa los registros.
Resistencia a manipulaciones: Firmas criptográficas en los registros (SHA-256, firmado con clave de administrador). Sin eliminación sin romper la cadena de confianza. Implementar almacenamiento de solo adición.
Herramientas: ELK Stack (Elasticsearch/Logstash/Kibana) para agregación y búsqueda; Splunk para empresas (retención estándar de 60 días).
Política de retención: HIPAA = 6 años, GDPR = derecho al olvido (anonimizar tras 6 meses), PCI-DSS = 1 año. Automatizar la purga con verificación criptográfica.
Verificación mensual de cumplimiento: Revisión de registros (comprobación aleatoria del 5% de los logs). Auditoría trimestral del linaje de datos (rastrear consultas hasta el origen). Evaluación anual de terceros (prueba de penetración, verificación de registros).
Fallos de cumplimiento más comunes
- Usar ChatGPT en la nube con datos sanitarios. Violación inmediata de HIPAA. Sanción: 10.000-50.000 USD por incidente (hasta 1.500.000 USD al año). Ejemplo: personal hospitalario usando ChatGPT para redactar informes de alta (PHI expuesta).
- Servidor air-gapped con puerta sin llave. La seguridad física = cero si cualquiera puede entrar. Ejemplo: un auditor de cumplimiento encontró el servidor LLM en una sala de servidores de acceso público sin control de acceso por credencial.
- Registros almacenados en el mismo servidor que los datos. Brecha en los registros = brecha en la pista de auditoría. Se requieren sistemas separados (45 CFR 164.312(b)). Ejemplo: ransomware cifró tanto los datos como los registros, destruyendo la pista de auditoría.
- Sin cifrado de datos en tránsito. Transferencias USB sin cifrar en red compartida. Un ataque de sniffing captura historiales médicos. Usa archivos cifrados con GPG y verifica los checksums.
- BAA con modelos de código abierto. Los modelos de código abierto (Llama, Mistral) no tienen proveedor que firme un BAA. En su lugar, documenta tu cumplimiento internamente (registros de auditoría, evaluación de riesgos, DPIA). El BAA solo aplica a proveedores.
- Sin política de retención. HIPAA exige purgar tras 6 años. No eliminar = violación. Implementa scripts automatizados que eliminen los registros según un calendario con prueba criptográfica.
Preguntas frecuentes
¿Puedo usar LLMs en la nube con datos de cumplimiento si hasheo la PII?
No. Los datos hasheados siguen estando regulados. HIPAA/GDPR prohíben la transmisión a cualquier proveedor, incluidas las APIs en la nube. El hasheo no elimina los datos del control del proveedor. Usa solo LLM local.
¿Necesito un BAA con los modelos Llama o Mistral?
No. Los modelos de código abierto no tienen proveedor que firme un BAA. En su lugar, documenta tu cumplimiento internamente: evaluación de riesgos, procedimientos de tratamiento de datos, registros de auditoría, política de retención. El BAA solo es obligatorio si usas un proveedor (OpenAI, Anthropic, Google).
¿El despliegue air-gapped es excesivo para HIPAA?
No es excesivo si los datos son muy sensibles (genética, registros psiquiátricos). Mejor práctica según la Regla Ómnibus HIPAA (2013). Para datos menos sensibles (consultas básicas), un despliegue local protegido por VPN es aceptable con auditorías mensuales.
¿Cómo gestiono de forma segura el cese de un empleado?
Desactivar inmediatamente el acceso VPN. Auditar todas las consultas al LLM de ese usuario en los últimos 6 meses (requisito de cumplimiento). Verificar que no se exportaron datos confidenciales. Archivar los registros (solo lectura) durante 6 años (retención HIPAA). Eliminar al usuario de las listas de control de acceso.
¿Puedo usar LLM locales para el descubrimiento legal?
Sí. Air-gapped + supervisión del abogado mantiene el privilegio abogado-cliente (sin acceso de terceros). Documentar: cadena de custodia, procedimientos de tratamiento de datos, registros de acceso. Cumple los requisitos de descubrimiento electrónico (FRCP 34).
¿Qué ocurre si hay una brecha en el servidor local?
Cifrado en reposo = daño limitado (el atacante no puede leer los datos). Los registros de auditoría revelan a qué se accedió (solo consultas comprometidas). Notificar a las partes afectadas en 30 días (requisito HIPAA/GDPR). Respuesta al incidente: aislar el servidor, análisis forense, actualizar contraseñas, prueba de penetración.
¿Es la inferencia local más lenta que las APIs en la nube?
La latencia es ligeramente mayor (200 ms local vs. 50 ms en la nube), pero el rendimiento es comparable. El procesamiento por lotes (revisión legal, análisis de imágenes médicas) no muestra diferencia práctica. El chat en tiempo real es aceptable para la mayoría de los casos de uso.
¿Puedo almacenar las salidas del LLM local en la nube tras la inferencia?
Solo si está cifrado de extremo a extremo (tú posees la clave de cifrado, el proveedor de nube no puede acceder al texto plano). Recomendado: almacenar localmente y hacer copias de seguridad en almacenamiento cifrado en la nube (AWS S3 con cifrado del lado del servidor). Cumplir los requisitos de residencia de datos (EU = los datos permanecen en la EU).
Lecturas relacionadas
Fuentes
- Regla de Privacidad HIPAA: 45 CFR 164.300-318 (Departamento de Salud y Servicios Humanos de EE. UU., 2013)
- Regla de Seguridad HIPAA: 45 CFR 164.300-318 (Cifrado, controles de acceso, registro de auditoría)
- Estándar de Seguridad de Datos PCI v4.0 (PCI Security Standards Council, 2022) — Gestión de datos de tarjetas de pago
- GDPR Artículos 32, 35, 17 (Reglamento General de Protección de Datos, UE, 2016) — Seguridad, DPIA, derecho al olvido
- EU AI Act 2024/1689 (Unión Europea, 2024) — Gobernanza de sistemas de IA de alto riesgo
- BDSG alemán (Bundesdatenschutzgesetz, 2018) — Requisitos de residencia y tratamiento de datos