Réponse rapide
L'API DeepSeek présente le risque RGPD le plus élevé parmi les LLMs majeurs car les serveurs sont soumis à la loi chinoise d'accès aux données (PIPL), aucune décision d'adéquation UE n'existe pour la Chine, et les CGU se réservent explicitement le droit de partager les données avec les autorités chinoises. Les modèles DeepSeek open-weight en local ont un profil de risque différent et plus faible.
Mis à jour : 2026-05
Points clés
Trois facteurs cumulatifs font de l'API DeepSeek l'option la plus risquée pour les données réglementées RGPD. Premièrement : les serveurs sont en Chine, ce qui fait de chaque appel API un transfert vers un pays tiers selon l'Article 44 du RGPD. Deuxièmement : la Chine n'a pas de décision d'adéquation UE. Troisièmement : la loi chinoise PIPL contraint les organisations opérant en Chine à fournir des données aux autorités d'État sur demande.
Les CCT sont un mécanisme juridique valide pour les transferts vers la Chine. Cependant, post-Schrems II, les organisations doivent aussi conduire une EIT évaluant si les CCT fournissent une protection réelle en pratique. Pour la Chine, l'EIT est difficile à valider pour les données sensibles : PIPL peut outrepasser les protections contractuelles.
Cela s'applique à toutes les données personnelles : dossiers RH, données clients, notes médicales, correspondance juridique. Si vos prompts contiennent ces données, l'API DeepSeek crée une exposition réglementaire que les CCT seules peuvent ne pas résoudre.
Les modèles DeepSeek open-weight (R1, V3, Coder V2) sont un produit distinct de l'API. Publiés sous Apache 2.0, ils peuvent être téléchargés et exécutés localement sans connexion aux serveurs DeepSeek. L'exécution locale élimine entièrement le problème de transfert de l'Article 44 du RGPD.
DeepSeek R1 7B ou 8B en local tourne confortablement via Ollama sur un GPU 6–8 Go de VRAM. R1 est l'un des meilleurs modèles de raisonnement disponibles au tier 7B. Pour les tâches de code, DeepSeek Coder V2 est disponible en variantes plus compactes.
Question résiduelle pour DeepSeek local : la formation du modèle. DeepSeek n'a pas publié les détails complets des données d'entraînement. Pour les environnements à haute assurance (santé, juridique, gouvernement), cette incertitude peut être pertinente. Qwen 2.5 et Llama 4 offrent plus de transparence sur la provenance des données d'entraînement.
| Déploiement | Risque RGPD | Raison | Action recommandée |
|---|---|---|---|
| API DeepSeek | Le plus élevé | Serveurs chinois, PIPL, pas de décision d'adéquation | Éviter pour données personnelles ou sensibles |
| DeepSeek local (R1/V3) | Faible | Pas de transfert, poids Apache 2.0 | Acceptable ; noter l'opacité des données d'entraînement |
| Qwen local (2.5/3) | Faible | Pas de transfert, Apache 2.0, info formation publiée | Recommandé pour usage data-sensible |
| Claude / OpenAI API | Moyen | Juridiction US ; région UE réduit sans éliminer le risque | CCT + DPA requis ; région UE préférée |