RTX 3060 12GB : meilleur GPU sous 300 € pour LLM local (2026) ?

Lire en:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

Cette page contient des liens de référence vers des produits tiers. PromptQuorum n'est inscrit à aucun programme d'affiliation — ce sont de simples liens qui ne génèrent aucune commission. Cliquer sur les liens et vos prochaines étapes relèvent entièrement de votre responsabilité. Ces liens ne représentent aucune approbation ou vérification par PromptQuorum.

Réponse rapide

RTX 3060 12 GB d'occasion à 200–250 € est la meilleure GPU sous 300 € pour les LLMs locaux — 12 Go de VRAM suffit pour tous les modèles 7B et la plupart des 14B.

▸RTX 3060 12 GB fait tourner Llama 3 8B Q4_K_M à ~25 tok/s et Qwen 14B Q4_K_M à ~15 tok/s.
▸Sa bande passante de 360 GB/s bat la RTX 4060 plus récente (272 GB/s) en vitesse d'inférence LLM.
▸RX 6700 XT 12 GB est environ 40–60 € moins chère mais nécessite Linux pour ROCm ; éviter sur Windows.
▸Éviter les GPU 8 GB sous 300 € — le plafond VRAM bloque entièrement les modèles 14B.

Mis à jour : 2026-07

Hardware-SpecificIntermédiaire

Points clés

✓Meilleur choix : NVIDIA RTX 3060 12 GB d'occasion — CUDA fonctionne immédiatement avec Ollama et llama.cpp
✓Choix le moins cher : AMD RX 6700 XT d'occasion — 12 GB de VRAM, mais ROCm demande 3 à 5 heures de configuration
✓Les deux cartes exécutent tout modèle 7B et la plupart des 13B en Q4 ; aucune ne tient un modèle 70B
✓Acheter la RTX 3060 en version 12 GB — la variante 6 GB ne fait tourner que des 3B

Meilleur choix : NVIDIA RTX 3060 12 GB d'occasion

La NVIDIA RTX 3060 12 GB d'occasion est le meilleur GPU sous 300 € pour les LLM locaux : 12 GB de VRAM et CUDA sans configuration donnent un poste LLM opérationnel en quelques minutes. Elle exécute Mistral Small, Llama 3 8B et Qwen3 8B à 15-20 tokens par seconde, et la plupart des 13B en Q4.

La RTX 3060 gagne sur le logiciel. Ollama et llama.cpp détectent les GPU NVIDIA automatiquement via CUDA sous Windows et Linux — pas de chasse aux pilotes, pas de ROCm. La AMD RX 6700 XT offre la même capacité de 12 GB, mais ROCm sous Linux coûte typiquement 3 à 5 heures et n'est pas pris en charge sous Windows pour une inférence rapide.

Choisissez la RX 6700 XT uniquement si le budget est le seul critère et que Linux ne vous gêne pas. Sinon, la RTX 3060 12 GB est le premier GPU plus sûr. Évitez la variante 6 GB — elle semble identique en annonce mais ne tient que les modèles 3B.

Vérifier le prix RTX 3060 12GB sur Amazon.frlien produit · divulguéVérifier le prix RTX 3060 12GB sur LDLClien produit · divulguéVérifier le prix RX 6700 XT sur Amazon.frlien produit · divulgué

RTX 3060 12 GB vs RX 6700 XT pour LLM local

Les deux cartes embarquent 12 GB de VRAM, donc la capacité modèle est identique — le choix se joue entre CUDA et ROCm. Prix ci-dessous : aperçu du marché français en mai 2026 ; la pénurie mémoire de 2026 maintient les prix volatils, à revérifier.

GPU	VRAM	Prix (mai 2026)	Mise en route	Idéal pour
RTX 3060 12 GB	12 GB	330-400 € neuf	CUDA, instantané	Meilleur choix — zéro friction
RX 6700 XT	12 GB	vérifier le prix (occasion)	ROCm, 3-5 heures	La moins chère, configuration AMD acceptée

Lectures complémentaires

▸Meilleur GPU sous 600 € pour LLM local — la gamme au-dessus : RTX 4060 Ti 16 GB
▸Meilleurs modèles Ollama pour RTX 3060 12 GB — quels modèles charger
▸Guide d'achat GPU pour LLM local 2026 — la comparaison complète de huit GPU

Réponses rapides sur les GPU sous 300 € pour LLM local

Un GPU à 300 € peut-il faire tourner des LLM locaux ?▾

Oui. Une RTX 3060 12 GB ou RX 6700 XT d'occasion exécute chaque modèle 7B à 15-20 tokens par seconde et la plupart des 13B en Q4. Les 12 GB de VRAM suffisent pour le chat, l'assistance au code et le résumé.

Pourquoi choisir la RTX 3060 plutôt que la RX 6700 XT moins chère ?▾

La RTX 3060 utilise NVIDIA CUDA, détecté automatiquement par Ollama et llama.cpp. La RX 6700 XT exige ROCm — 3 à 5 heures sous Linux et non supporté sous Windows pour l'inférence rapide. Les 30-80 € économisés couvrent rarement ce temps.

Acheter la RTX 3060 6 GB ou 12 GB ?▾

Achetez la version 12 GB. La 6 GB ne tient que les modèles 3B, soit la moitié des paramètres d'un 7B. Les deux variantes ont des annonces identiques — vérifiez la VRAM avant achat.

Un GPU sous 300 € peut-il exécuter un modèle 70B ?▾

Non. Un modèle 70B en Q4 demande environ 40 GB de VRAM. Une carte 12 GB plafonne à 14B en Q4. Pour des modèles plus grands, il faut une gamme supérieure ou un montage multi-GPU.

Vous voulez les détails complets ?

Lire le guide complet →

Prompt Bites associés

← Retour aux Prompts en bref