Points clés
- Même VRAM : les deux modèles 7B nécessitent 5,5 Go en Q4_K_M ; les 32B nécessitent 20,5 Go
- Maths : DeepSeek-R1-Distill-Qwen-32B gagne (94 % MATH-500 vs 90,3 %)
- Code : Qwen2.5-Coder 32B gagne (91,5 % HumanEval vs 83,2 %)
- Texte chinois : Qwen2.5 — tokenisation native, 30–40 % plus efficace sur le CJK
- Raisonnement : les distillats DeepSeek-R1 produisent des chaînes de pensée par défaut
- Conformité RGPD : les deux fonctionnent entièrement localement — aucun transfert de données
Tableau de benchmarks direct
Tous les scores en quantisation Q4_K_M.
Quel modèle à quel niveau matériel
Les besoins VRAM sont identiques entre les deux familles. Le choix est une préférence de tâche.
- 8 Go VRAM (RTX 3060 / M2 16 Go) : Qwen2.5 7B pour le code ; DS-R1-Distill-Qwen-7B pour les maths
- 24 Go VRAM (RTX 4090 / M3 Max 48 Go) : Qwen2.5-Coder 32B — meilleur modèle polyvalent
- CPU uniquement (32+ Go RAM) : Qwen2.5 7B ou DS-R1-Distill 7B — 3–8 t/s sur CPU moderne
Modèles locaux DeepSeek expliqués
DeepSeek-R1 est un modèle MoE 671B nécessitant du matériel serveur. Pour usage local, les versions distillées sont l'option pratique.
- DS-R1-Distill-Qwen-7B : 5,5 Go VRAM. 88 % MATH-500 — meilleur modèle maths du tier 7B.
- DS-R1-Distill-Qwen-32B : 20,5 Go VRAM. 94 % MATH-500 — meilleur score maths parmi les modèles grand public.
- Commande Ollama :
ollama run deepseek-r1:7b
Modèles locaux Qwen2.5 expliqués
Qwen2.5 est la version d'octobre 2025 d'Alibaba. Tous les modèles de base utilisent un contexte de 128K tokens et une licence Apache 2.0.
- Qwen2.5 7B : 5,5 Go VRAM. Meilleur polyvalent 7B pour le code et le texte chinois.
- Qwen2.5-Coder 32B : 20,5 Go VRAM. 91,5 % HumanEval — meilleur modèle de code pour matériel grand public.
- Commande Ollama :
ollama run qwen2.5:14b-instruct-q4_K_M
Apple Silicon vs NVIDIA
Les deux familles fonctionnent bien sur Apple Silicon via Ollama avec accélération Metal.
Verdicts par cas d'usage
Réponse en une phrase pour chaque usage courant :
- Maths / cours particuliers : DS-R1-Distill-Qwen-7B — 88 % MATH-500 vs 62,5 % pour Qwen2.5 7B
- Génération / révision de code : Qwen2.5-Coder 32B — 91,5 % HumanEval
- Chat en chinois : Qwen2.5 7B — tokenisation CJK native, 30–40 % plus efficace
- Conformité RGPD : les deux options — exécution 100 % locale, pas de transfert de données
FAQ
DeepSeek-R1 est-il identique aux modèles distillés ?
Non. DeepSeek-R1 est le modèle MoE 671B. Les versions distillées (7B, 14B, 32B) sont des modèles denses séparés, pratiques pour usage local.
DeepSeek et Qwen nécessitent-ils la même VRAM ?
Oui, à quantisation équivalente. Les deux modèles 7B nécessitent environ 5,5 Go en Q4_K_M ; les 32B nécessitent 20,5 Go.
Lequel est le mieux pour le texte chinois ?
Qwen2.5 est nettement meilleur. Il utilise un tokeniseur chinois natif, 30–40 % plus efficace sur le texte CJK.
Ces modèles sont-ils conformes au RGPD ?
En exécution locale, aucune donnée ne quitte votre matériel. Cela simplifie considérablement la documentation RGPD : pas de DPA requis avec des fournisseurs externes. Consultez un juriste pour votre situation spécifique.