Schnelle Antwort
Ja — ein Open-Weight-Modell lokal zu betreiben beseitigt den Artikel-44-Drittlandtransfer, der Cloud-KI unter der DSGVO rechtlich komplex macht: Prompts und Antworten verlassen Ihren Server nie. Lokale Modelle wie Qwen 2.5 14B oder Llama 4 Scout können HR-, Rechts- und medizinische Texte vollständig lokal verarbeiten.
Aktualisiert: 2026-05
Wichtigste Punkte
Jedes Mal, wenn Sie einen Prompt an ein Cloud-LLM (ChatGPT, Claude, Gemini) senden, werden alle personenbezogenen Daten in diesem Prompt auf einen Server außerhalb der EU übertragen. DSGVO-Artikel 44 erfordert eine Rechtsgrundlage für diesen Transfer — üblicherweise Standardvertragsklauseln plus eine Transferfolgenabschätzung. Das ist die Compliance-Last, die Cloud-KI erzeugt. Lokale LLMs beseitigen sie, indem sie den Transfer vollständig vermeiden.
Wenn ein lokales Modell auf Ihrer eigenen Hardware läuft, erfolgt die Datenverarbeitung jurisdiktionsintern. Das Modell empfängt Ihren Prompt und generiert eine Antwort vollständig auf Ihrer CPU oder GPU — kein Netzwerkaufruf verlässt Ihr Gebäude. Dies erfüllt Artikel 44 (kein Transfer, keine Rechtsgrundlage nötig), Artikel 25 (Datenschutz durch Technikgestaltung) und Artikel 5(1)(f) (Integrität und Vertraulichkeit der Daten).
Dies ist keine Ausrede oder Umgehung — es ist die von DSGVO-Regulatoren beschriebene Privacy-by-Design-Architektur. Wenn EU-Institutionen Leitlinien zu KI und DSGVO veröffentlichen, wird lokale Verarbeitung konsequent als Deployment-Modell mit geringstem Risiko identifiziert.
Drei Open-Weight-Modelle decken die wichtigsten DSGVO-regulierten Workflows im Jahr 2026 ab. Für allgemeines HR, Recht und Dokumentenerststellung: Qwen 2.5 14B Q4_K_M (benötigt 10–12 GB VRAM). Für Code-Analyse und technische Dokumentation: Qwen 2.5 Coder 14B (gleiches VRAM, stärker bei strukturierter Ausgabe). Für Organisationen mit einer GPU oder engerer Hardware: Qwen 3 8B Q4_K_M (6–8 GB VRAM).
Alle drei laufen via Ollama mit einem einzigen Befehl und benötigen nach dem einmaligen Modell-Download keine Cloud-Konnektivität mehr. Das Modell kann einmalig über HTTPS von Hugging Face heruntergeladen werden, auch auf einem Air-Gap-Rechner via Datenträger. Danach: vollständig offline.
Für größere Organisationen, die nahezu frontier-nahe Qualität benötigen: Llama 4 Scout (17B MoE) passt auf 24 GB VRAM mit einem 10M-Token-Kontextfenster — geeignet für die Verarbeitung langer Verträge, HR-Richtlinien oder medizinischer Unterlagen in einem einzigen Kontext.
| Workflow | Empfohlenes Modell | Benötigtes VRAM | Ollama-Befehl |
|---|---|---|---|
| HR-Dokumente, Zusammenfassungen | Qwen 2.5 14B Q4_K_M | 10–12 GB | ollama run qwen2.5:14b |
| Rechtsentwürfe, Verträge | Qwen 2.5 14B Q4_K_M | 10–12 GB | ollama run qwen2.5:14b |
| Code, technische Dokumente | Qwen 2.5 Coder 14B | 10–12 GB | ollama run qwen2.5-coder:14b |
| Budget / 8 GB VRAM | Qwen 3 8B Q4_K_M | 6–8 GB | ollama run qwen3:8b |
| Lange Dokumente (>100K Token) | Llama 4 Scout | 24 GB | ollama run llama4:scout |