Home/Local LLMs/Mejor configuración de LLM local para datos sensibles

Privacy & Business

Mejor configuración de LLM local para datos sensibles

Last updated: May 2026·12 min de lectura·Por Hans Kuepper · Fundador de PromptQuorum, herramienta de despacho multi-modelo · PromptQuorum

Leer en:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es

Los LLM locales garantizan cero egreso de datos: historial médico, documentos financieros y escritos legales nunca salen de tu máquina.

Los LLM locales garantizan cero egreso de datos: historial médico, documentos financieros y escritos legales nunca salen de tu máquina. Desde abril de 2026, los sectores sujetos a regulación estricta (sanidad HIPAA, finanzas PCI-DSS, privilegio abogado-cliente legal) exigen inferencia air-gapped. Esta guía cubre la configuración segura, el registro de auditoría y la verificación de cumplimiento.

Key Takeaways

HIPAA (sanidad): Los datos de pacientes no pueden llegar a APIs en la nube. LLM local en red aislada, almacenamiento cifrado, registros de acceso.
PCI-DSS (tarjetas de pago): Los datos de tarjetas no pueden procesarse con LLMs en absoluto. Úsalos solo para análisis, nunca con el número completo (PAN).
Legal (privilegio abogado-cliente): Los documentos privilegiados no pueden salir del control del abogado. Máquina air-gapped, sin red, solo salida en papel.
Configuración: Ollama o vLLM en servidor Linux aislado, sistema de archivos cifrado (LUKS), registro de auditoría (ELK), sin internet. Coste: 3.000-5.000 USD hardware + 2.000 USD/año en actualizaciones.
EU/GDPR: Artículo 32 (Seguridad), Artículo 35 (DPIA obligatoria), AI Act 2024/1689 (evaluación de riesgos). Residencia de datos = solo almacenamiento local.
vs APIs en la nube: Nube = el proveedor controla los datos + responsabilidad por brechas. Local = tú controlas + cero riesgo de brechas.

¿Por qué LLM locales para el cumplimiento?

Las APIs en la nube (ChatGPT, Claude, Gemini) no pueden usarse con datos regulados:

La transmisión de datos a la nube = violación de confidencialidad (HIPAA, privilegio legal).

No existe opción de "modo privado". Los datos acaban entrenando modelos (las condiciones del proveedor lo permiten).

Dependencia del proveedor: si el proveedor sufre una brecha o cierra, pierdes datos y el estado de cumplimiento.

Los LLM locales garantizan:

Cero egreso de datos (air-gapped = sin red, sin nube).

Pista de auditoría (cada acceso queda registrado, firmado criptográficamente, inmutable).

Control total (tú eres propietario de los datos, las claves de cifrado y todo el stack).

Costes predecibles (sin cargos por token después de la inversión inicial de 5.000 USD en hardware).

Configuración compatible con HIPAA (Sanidad)

La PHI (Información de Salud Protegida) no puede ser procesada por sistemas no confiables. HIPAA exige cifrado, controles de acceso y registro de auditoría (45 CFR 164.312).

1
Aislar el servidor: Máquina Linux dedicada (sin recursos compartidos), sin internet, USB cifrado para transferencia de datos de entrada/salida.
2
Cifrar el almacenamiento: Cifrado de disco completo LUKS, AES-256, protegido con frase de contraseña. Evita la filtración de datos si el hardware es robado.
3
Aislamiento de red: VLAN dedicada o air-gapped (sin red). Acceso mediante VPN con MFA, o solo terminal físico.
4
Registro de auditoría: Cada consulta al LLM queda registrada: marca de tiempo, ID de usuario, hash del documento (no texto plano), longitud de respuesta, modelo utilizado. Logs almacenados en servidor syslog cifrado separado.
5
Control de acceso: Basado en roles (médico vs. administrador vs. investigador). MFA para el inicio de sesión. Sin contraseñas compartidas. Desactivar cuenta al cesar la relación laboral.
6
Política de retención: Eliminar los registros de inferencia tras 6 años (requisito HIPAA: 45 CFR 164.312). Scripts de purga automatizados con verificación criptográfica.
7
Acuerdo de Socio Comercial (BAA): Solo aplica a proveedores. Los modelos de código abierto (Llama, Mistral) requieren documentación interna de cumplimiento, no firmas de proveedor.
8
Prueba de penetración anual: Auditoría de seguridad de terceros para verificar que no hay exfiltración de datos, credenciales por defecto ni vulnerabilidades sin parchear.

Configuración compatible con PCI-DSS (Finanzas)

Los datos de tarjetas de pago (PAN = Número de Cuenta Principal) no pueden procesarse mediante LLMs. PCI-DSS v4.0 exige 12 requisitos fundamentales.

1
Nunca introduzcas números de tarjeta completos en un LLM. PCI-DSS lo prohíbe totalmente. Usa representaciones tokenizadas (solo los últimos 4 dígitos, sin fecha de caducidad).
2
Cifrado en reposo y en tránsito: Archivos cifrados AES-256, TLS 1.3 para la red. Todos los datos de tarjeta se cifran antes de salir del terminal.
3
Segmentación de red: Servidor LLM en VLAN aislada con reglas de cortafuegos. Sin acceso a internet, sin acceso a la red corporativa.
4
Módulo de seguridad de hardware (HSM): Almacena las claves de cifrado en un dispositivo resistente a manipulaciones (Thales, Yubico HSM). Separado del servidor LLM.
5
Registro y monitorización: Alertas en tiempo real sobre acceso a archivos, intentos de inicio de sesión, autenticación fallida, exfiltración de datos. Integración SIEM (Splunk, ELK).
6
Escaneo de cumplimiento trimestral: Escaneo PCI-DSS automatizado (Qualys, Nessus, Rapid7) para detectar vulnerabilidades. Remediar en 30 días.
7
Documentación del proveedor: Los proveedores de modelos (Ollama, vLLM) no son procesadores de pago ni proveedores PCI. Tu despliegue local está dentro del alcance.

Despliegue air-gapped

La opción más segura: la máquina no tiene ninguna conexión de red (aislamiento a nivel de jaula de Faraday).

1
Aislamiento físico: Servidor en sala con llave (control de acceso físico), sin cable Ethernet, WiFi desactivado en la BIOS, Bluetooth desactivado.
2
Carga del modelo: Descarga previa de modelos en una máquina conectada (desde HuggingFace), transferencia mediante USB cifrado (cifrado GPG, AES-256).
3
Transferencia de datos entrante: Los usuarios transfieren documentos mediante USB cifrado (cifrado GPG o 7z). Analizar el USB en busca de malware en la máquina air-gapped.
4
Inferencia: Ejecutar el LLM localmente (Ollama, vLLM), salida guardada en el USB. Sin llamadas de red, sin acceso a API externas.
5
Transferencia de datos saliente: El USB cifrado se devuelve al usuario y se descifra en una máquina no sensible separada. El USB cifrado original se destruye tras verificar el descifrado.
6
Compensación: Latencia (la transferencia manual por USB tarda minutos) vs. seguridad absoluta (cero riesgo de red, cero posibilidad de brecha remota).
7
Caso de uso: Descubrimiento legal (revisión por abogado), análisis de imágenes médicas, entrenamiento de modelos financieros (procesamiento por lotes con latencia de 1 hora aceptable).

Modelos recomendados y dimensionamiento de hardware

Elige los modelos según los requisitos de cumplimiento y el tamaño de la infraestructura.

Caso de uso	Modelo	VRAM	Hardware	Por qué
Revisión de documentos (Legal)	LLaMA 4 Scout (7B)	8-12 GB	RTX 4060 / M4 Max	Razonamiento legal rápido y preciso, huella reducida
Historial médico (HIPAA)	Mistral Large (34B)	32-40 GB	RTX 4090 / A100 (40 GB)	Alta precisión, conocimiento médico, cumple los requisitos HIPAA
Análisis financiero (PCI)	Llama 3.1 70B	70-80 GB	A100 (80 GB) / H100	Razonamiento financiero, pistas de auditoría de cumplimiento
Equipos pequeños (<10)	Mistral 7B Instruct	8-16 GB	M3/M4 Pro o RTX 4070	Rentable, suficiente para gestión básica de documentos

Comparativa LLM local vs API en la nube

Comparación directa de modelos de despliegue.

Factor	LLM local	API en la nube
Seguridad de datos	Cero egreso. Los datos permanecen on-premise. Cifrados en reposo y en tránsito.	Datos enviados a servidores del proveedor. El proveedor puede entrenar con ellos (ToS lo permite). Responsabilidad de brecha recae en el proveedor.
Cumplimiento	Compatible con HIPAA/PCI/GDPR. Registros de auditoría bajo tu control. DPIA requerida pero de bajo riesgo.	No cumple las regulaciones. El proveedor es el procesador de datos, tú eres el responsable.
Coste	3.000-5.000 USD de hardware inicial. 0-500 USD/año de mantenimiento. Predecible.	0 USD inicial. 500.000 USD+/año a escala (tokens × precios 2026). Impredecible.
Responsabilidad por brecha	0 USD (los datos nunca salen de tu control). No se requiere seguro.	50.000-5.000.000 USD+ (brecha del proveedor = tú eres responsable ante los afectados según HIPAA/GDPR).

Registro de auditoría y gobernanza de datos

Qué registrar: Cada consulta al LLM (marca de tiempo, usuario, hash del prompt, longitud de respuesta, versión del modelo), acceso a archivos (abrir/leer/modificar), inicio/cierre de sesión (IP, estado de MFA).

Dónde almacenar: Servidor syslog cifrado, máquina física separada del servidor LLM. Evita que una brecha de datos comprometa los registros.

Resistencia a manipulaciones: Firmas criptográficas en los registros (SHA-256, firmado con clave de administrador). Sin eliminación sin romper la cadena de confianza. Implementar almacenamiento de solo adición.

Herramientas: ELK Stack (Elasticsearch/Logstash/Kibana) para agregación y búsqueda; Splunk para empresas (retención estándar de 60 días).

Política de retención: HIPAA = 6 años, GDPR = derecho al olvido (anonimizar tras 6 meses), PCI-DSS = 1 año. Automatizar la purga con verificación criptográfica.

Verificación mensual de cumplimiento: Revisión de registros (comprobación aleatoria del 5% de los logs). Auditoría trimestral del linaje de datos (rastrear consultas hasta el origen). Evaluación anual de terceros (prueba de penetración, verificación de registros).

Fallos de cumplimiento más comunes

Usar ChatGPT en la nube con datos sanitarios. Violación inmediata de HIPAA. Sanción: 10.000-50.000 USD por incidente (hasta 1.500.000 USD al año). Ejemplo: personal hospitalario usando ChatGPT para redactar informes de alta (PHI expuesta).
Servidor air-gapped con puerta sin llave. La seguridad física = cero si cualquiera puede entrar. Ejemplo: un auditor de cumplimiento encontró el servidor LLM en una sala de servidores de acceso público sin control de acceso por credencial.
Registros almacenados en el mismo servidor que los datos. Brecha en los registros = brecha en la pista de auditoría. Se requieren sistemas separados (45 CFR 164.312(b)). Ejemplo: ransomware cifró tanto los datos como los registros, destruyendo la pista de auditoría.
Sin cifrado de datos en tránsito. Transferencias USB sin cifrar en red compartida. Un ataque de sniffing captura historiales médicos. Usa archivos cifrados con GPG y verifica los checksums.
BAA con modelos de código abierto. Los modelos de código abierto (Llama, Mistral) no tienen proveedor que firme un BAA. En su lugar, documenta tu cumplimiento internamente (registros de auditoría, evaluación de riesgos, DPIA). El BAA solo aplica a proveedores.
Sin política de retención. HIPAA exige purgar tras 6 años. No eliminar = violación. Implementa scripts automatizados que eliminen los registros según un calendario con prueba criptográfica.

Preguntas frecuentes

¿Puedo usar LLMs en la nube con datos de cumplimiento si hasheo la PII?

No. Los datos hasheados siguen estando regulados. HIPAA/GDPR prohíben la transmisión a cualquier proveedor, incluidas las APIs en la nube. El hasheo no elimina los datos del control del proveedor. Usa solo LLM local.

¿Necesito un BAA con los modelos Llama o Mistral?

No. Los modelos de código abierto no tienen proveedor que firme un BAA. En su lugar, documenta tu cumplimiento internamente: evaluación de riesgos, procedimientos de tratamiento de datos, registros de auditoría, política de retención. El BAA solo es obligatorio si usas un proveedor (OpenAI, Anthropic, Google).

¿El despliegue air-gapped es excesivo para HIPAA?

No es excesivo si los datos son muy sensibles (genética, registros psiquiátricos). Mejor práctica según la Regla Ómnibus HIPAA (2013). Para datos menos sensibles (consultas básicas), un despliegue local protegido por VPN es aceptable con auditorías mensuales.

¿Cómo gestiono de forma segura el cese de un empleado?

Desactivar inmediatamente el acceso VPN. Auditar todas las consultas al LLM de ese usuario en los últimos 6 meses (requisito de cumplimiento). Verificar que no se exportaron datos confidenciales. Archivar los registros (solo lectura) durante 6 años (retención HIPAA). Eliminar al usuario de las listas de control de acceso.

¿Puedo usar LLM locales para el descubrimiento legal?

Sí. Air-gapped + supervisión del abogado mantiene el privilegio abogado-cliente (sin acceso de terceros). Documentar: cadena de custodia, procedimientos de tratamiento de datos, registros de acceso. Cumple los requisitos de descubrimiento electrónico (FRCP 34).

¿Qué ocurre si hay una brecha en el servidor local?

Cifrado en reposo = daño limitado (el atacante no puede leer los datos). Los registros de auditoría revelan a qué se accedió (solo consultas comprometidas). Notificar a las partes afectadas en 30 días (requisito HIPAA/GDPR). Respuesta al incidente: aislar el servidor, análisis forense, actualizar contraseñas, prueba de penetración.

¿Es la inferencia local más lenta que las APIs en la nube?

La latencia es ligeramente mayor (200 ms local vs. 50 ms en la nube), pero el rendimiento es comparable. El procesamiento por lotes (revisión legal, análisis de imágenes médicas) no muestra diferencia práctica. El chat en tiempo real es aceptable para la mayoría de los casos de uso.

¿Puedo almacenar las salidas del LLM local en la nube tras la inferencia?

Solo si está cifrado de extremo a extremo (tú posees la clave de cifrado, el proveedor de nube no puede acceder al texto plano). Recomendado: almacenar localmente y hacer copias de seguridad en almacenamiento cifrado en la nube (AWS S3 con cifrado del lado del servidor). Cumplir los requisitos de residencia de datos (EU = los datos permanecen en la EU).

Lecturas relacionadas

Fuentes

Regla de Privacidad HIPAA: 45 CFR 164.300-318 (Departamento de Salud y Servicios Humanos de EE. UU., 2013)
Regla de Seguridad HIPAA: 45 CFR 164.300-318 (Cifrado, controles de acceso, registro de auditoría)
Estándar de Seguridad de Datos PCI v4.0 (PCI Security Standards Council, 2022) — Gestión de datos de tarjetas de pago
GDPR Artículos 32, 35, 17 (Reglamento General de Protección de Datos, UE, 2016) — Seguridad, DPIA, derecho al olvido
EU AI Act 2024/1689 (Unión Europea, 2024) — Gobernanza de sistemas de IA de alto riesgo
BDSG alemán (Bundesdatenschutzgesetz, 2018) — Requisitos de residencia y tratamiento de datos

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs