Schnelle Antwort
Die DeepSeek-API stellt das höchste DSGVO-Risiko unter den großen LLMs dar: Server unterliegen dem chinesischen Datenzugriffsrecht (PIPL), es gibt keine EU-Angemessenheitsentscheidung für China, und die Nutzungsbedingungen behalten ausdrücklich das Recht vor, Daten mit chinesischen Behörden zu teilen. Lokale DeepSeek-Open-Weight-Modelle haben ein deutlich niedrigeres Risikoprofil.
Aktualisiert: 2026-05
Wichtigste Punkte
Drei kumulative Faktoren machen die DeepSeek-API zur riskantesten Option für DSGVO-regulierte Daten unter den großen LLMs. Erstens: Server befinden sich in China, was jeden API-Aufruf zu einem DSGVO-Artikel-44-Drittlandtransfer macht. Zweitens: China hat keine EU-Angemessenheitsentscheidung. Drittens: Chinas Datenschutzgesetz für personenbezogene Informationen (PIPL) verpflichtet in China tätige Organisationen, Daten auf staatliche Anfrage bereitzustellen.
Standardvertragsklauseln sind ein gültiger rechtlicher Mechanismus für Transfers nach China. Nach Schrems II müssen Organisationen jedoch auch eine Transferfolgenabschätzung durchführen, die bewertet, ob SCC in der Praxis wirksamen Schutz bieten. Für China ist die TFA für sensible Daten schwer zu bestehen: PIPL überschreibt vertragliche Schutzmaßnahmen.
Dies gilt für alle personenbezogenen Daten: HR-Unterlagen, Kundendaten, medizinische Notizen, rechtliche Korrespondenz. Falls Ihre Prompts derartige Daten enthalten, schafft die DeepSeek-API regulatorisches Risiko, das SCC allein möglicherweise nicht heilen kann.
Die Open-Weight-DeepSeek-Modelle (R1, V3, Coder V2) sind ein separates Produkt von der API. Sie sind unter Apache 2.0 verfügbar und können ohne Verbindung zu DeepSeek-Servern lokal ausgeführt werden. Die Ausführung lokaler Gewichte beseitigt das DSGVO-Artikel-44-Transferproblem vollständig.
Lokales DeepSeek R1 7B oder 8B läuft komfortabel über Ollama auf einer 6–8 GB VRAM GPU. R1 ist eines der stärksten Reasoning-Modelle auf dem 7B-Tier. Für Coding-Aufgaben ist DeepSeek Coder V2 in kleineren Varianten verfügbar.
Die verbleibende Frage für lokales DeepSeek: Model-Training. DeepSeek hat keine vollständigen Details zu den Trainingsdaten veröffentlicht. Für hochsichere Umgebungen (Gesundheitswesen, Recht, Behörden) kann diese Unklarheit relevant sein. Qwen 2.5 und Llama 4 bieten mehr Transparenz bei der Herkunft der Trainingsdaten.
| Bereitstellung | DSGVO-Risiko | Begründung | Empfohlene Maßnahme |
|---|---|---|---|
| DeepSeek-API | Höchstes | Chinesische Server, PIPL, keine Angemessenheitsentscheidung | Für personenbezogene oder sensible Daten vermeiden |
| DeepSeek lokal (R1/V3) | Niedrig | Kein Transfer, Apache-2.0-Gewichte | Akzeptabel; Intransparenz bei Trainingsdaten beachten |
| Qwen lokal (2.5/3) | Niedrig | Kein Transfer, Apache 2.0, veröffentlichte Trainingsdaten-Info | Für datensensible Nutzung empfohlen |
| Claude / OpenAI API | Mittel | US-Jurisdiktion; EU-Region reduziert aber eliminiert nicht das Risiko | SCC + AVV erforderlich; EU-Region bevorzugen |