Réponses rapides aux questions sur les LLM locaux
67 guides à réponse rapide. Besoins en VRAM, choix Ollama, comparaisons matérielles et conseils de configuration — répondus en 60 secondes.
| VRAM | Meilleur modèle (mai 2026) | Quantisation | Cas d'usage |
|---|---|---|---|
| 4 Go | Phi-4 Mini | Q4 | Chat simple, petites tâches |
| 6 Go | Llama 3 8B | Q4_K_M | Chat et code au quotidien |
| 8 Go | Mistral 7B | Q5_K_M | Équilibre qualité + vitesse |
| 12 Go | Qwen 14B | Q4_K_M | Code et raisonnement |
| 16 Go | Qwen 32B | Q4_K_M | Tâches multi-étapes complexes |
| 24 Go | Llama 70B | Q4_K_M (partiel) | Qualité quasi-production |
| 48+ Go | Llama 70B | Q5_K_M ou plus | Modèles pleine précision |
AQuantisation & VRAM
La quantité de mémoire nécessaire, le format de quantisation à choisir et les arbres de décision VRAM.
Qu'est-ce que la quantisation Q4_K_M ?
Q4_K_M ou Q8_0 : lequel choisir ?
Combien de VRAM pour un modèle 70B ?
Meilleur LLM local pour 6 Go de VRAM ?
BOllama
Dernières versions, meilleurs modèles, fenêtres contextuelles, vision et utilisation CPU uniquement.
CComparaisons d'outils
Comparaisons en duo : Ollama vs LM Studio, Jan vs LM Studio, Qwen vs DeepSeek.
DComparaisons de modèles
Meilleurs modèles 14B, modèles MoE, mini-PC et confrontations directes entre modèles.
EMatériel spécifique
Choix matériels et guides d'achat : recommandations GPU par budget, mini-PC, SSD, GPU cloud et eGPU.
FRéponses rapides
Réponses oui/non et à un seul chiffre : limites RAM, recommandations d'ordinateurs portables.
GPrompt Engineering
Définitions rapides et meilleures listes pour les concepts d'ingénierie de prompt.
HConfidentialité & conformité
Conformité RGPD, souveraineté des données et déploiement d'IA locale respectueux de la vie privée.