Points clés
- Le GPU fixe le niveau ; le reste de la configuration le soutient. Un PC pour IA locale se choisit GPU en premier, car la VRAM décide des modèles exécutables. Choisissez le niveau dont la VRAM du GPU correspond à votre modèle visé, puis dimensionnez le processeur, la RAM et l'alimentation autour de lui.
- Les prix des GPU en 2026 ont renchéri chaque configuration. Une pénurie de puces mémoire a poussé les prix des GPU à 1,5-2 fois au-dessus du tarif conseillé. Les totaux ici sont des instantanés de mai 2026 et dépassent ce que coûtaient les mêmes pièces il y a un an — appuyez-vous sur le marché de l'occasion pour les GPU.
- Configuration budget (env. 1 250 €) : RTX 4060 Ti 16 GB, Ryzen 7 7700, 32 GB de RAM, SSD 1 To, alimentation 650 W — exécute les modèles 7B-13B à vitesse utilisable. La machine complète la moins chère pour l'IA locale.
- Configuration intermédiaire (env. 2 550 €) : RTX 4070 Ti Super 16 GB, Ryzen 9 7900X, 64 GB de RAM, SSD 2 To, alimentation 850 W — exécute les modèles 14B-33B et rend les modèles 7B-14B instantanés.
- Configuration enthousiaste (env. 5 300 €) : RTX 5090 32 GB, Ryzen 9 7950X, 128 GB de RAM, SSD 4 To, alimentation 1000 W — la seule configuration mono-GPU dans laquelle un modèle 70B tient en Q4.
- La RAM ne remplace pas la VRAM. La mémoire système permet à un modèle de déborder de la VRAM, mais un modèle exécuté depuis la RAM est trop lent pour un usage interactif. Achetez assez de VRAM pour le modèle ; achetez de la RAM pour le système d'exploitation et l'outillage.
- L'alimentation évolue avec le GPU. Une configuration budget exige 650 W, l'intermédiaire 850 W et l'enthousiaste 1000 W, car la seule RTX 5090 consomme 575 W. Budgétez l'alimentation en même temps que la carte.
- Les GPU d'occasion sont le bon plan en 2026. Une RTX 4090 ou une RTX 4060 Ti d'occasion échappe à l'essentiel de la hausse — achetez une carte d'occasion vérifiée pour contenir le total de la configuration.
Faits rapides
- Configuration budget (env. 1 250 €) : GPU RTX 4060 Ti 16 GB — exécute les modèles 7B et la plupart des 13B.
- Configuration intermédiaire (env. 2 550 €) : GPU RTX 4070 Ti Super 16 GB — exécute aisément le 14B, travail léger en 22B-33B.
- Configuration enthousiaste (env. 5 300 €) : GPU RTX 5090 32 GB — exécute aisément le 33B et le 70B en Q4.
- Règle empirique de VRAM en Q4_K_M : environ 0,6 GB par milliard de paramètres, plus 2-4 GB pour le contexte et l'outillage.
- Recommandation de RAM système : 32 GB pour la configuration budget, 64 GB pour l'intermédiaire, 128 GB pour l'enthousiaste.
- Alimentation par niveau : 650 W budget, 850 W intermédiaire, 1000 W enthousiaste — la RTX 5090 consomme 575 W à elle seule.
- Réalité tarifaire de 2026 : les prix des GPU sont à 1,5-2 fois le tarif conseillé sur fond de pénurie mémoire — vérifiez les prix en direct et envisagez les cartes d'occasion.
Choix de la rédaction : la configuration intermédiaire (env. 2 550 €)
Pour la plupart des acheteurs montant un PC pour l'IA locale, la configuration intermédiaire est le niveau qui équilibre capacité, coût et marge. Bâtie autour d'une RTX 4070 Ti Super 16 GB, elle exécute chaque modèle 14B avec de la marge de contexte, gère le travail léger en 22B-33B et rend les modèles 7B-14B instantanés — pour environ 2 550 € au total. C'est la configuration qui ne vous frustrera pas en quelques mois et ne nécessitera pas d'être remplacée en un an. Ne descendez à la configuration budget que si votre plafond est fermement les modèles 7B-13B ; ne montez à la configuration enthousiaste que si vous avez spécifiquement besoin du travail 70B. La configuration intermédiaire est le choix par défaut sûr pour une machine que vous voulez garder.
📌Note: Ce choix de la rédaction reflète uniquement le rapport prix/capacité. PromptQuorum n'est inscrit à aucun programme d'affiliation et les liens ci-dessous ne portent aucune balise affiliée — ce sont de simples liens de référence qui ne génèrent aucune commission.
Comment se comparent les trois niveaux en 2026
Les chiffres de VRAM et de puissance du GPU sont des spécifications constructeur. Les vitesses d'inférence sont des estimations au niveau de la famille de modèles, issues des tests GPU de PromptQuorum pour le GPU du niveau concerné. Les totaux sont des instantanés américains de mai 2026 — la hausse des prix des GPU en 2026 a poussé les cartes à 1,5-2 fois le tarif conseillé, si bien que la ligne GPU domine chaque total et bouge d'une semaine à l'autre. Acheter le GPU d'occasion abaisse chaque total.
📍 En une phrase
Pour un PC dédié à l'IA locale, la VRAM du GPU décide des modèles que la machine peut exécuter et le reste de la liste de pièces est dimensionné pour soutenir ce GPU — choisissez le niveau d'abord selon la taille du modèle.
💬 En termes simples
Voyez la configuration comme une équipe bâtie autour d'une vedette, le GPU. Le processeur, la RAM et l'alimentation sont les seconds rôles — utiles, mais ils existent pour alimenter le GPU. Choisissez d'abord le GPU dont votre modèle a besoin, puis assemblez le reste autour de lui.
| Niveau | GPU | VRAM | Exécute | Alimentation | Total (mai 2026) |
|---|---|---|---|---|---|
| Budget | RTX 4060 Ti 16 GB | 16 GB | modèles 7B-13B | 650 W | env. 1 250 € |
| Intermédiaire | RTX 4070 Ti Super 16 GB | 16 GB | 14B aisément, 22B-33B léger | 850 W | env. 2 550 € |
| Enthousiaste | RTX 5090 32 GB | 32 GB | 33B aisément, 70B en Q4 | 1000 W | env. 5 300 € |
Quelle configuration choisir ?
Votre plus grand modèle visé fixe le niveau ; votre budget le confirme. Trouvez la ligne qui correspond à votre situation.
| Votre situation | Montez ceci |
|---|---|
| J'exécute des modèles 7B-13B et je veux la machine complète la moins chère | Configuration budget (env. 1 250 €) |
| Je veux un premier PC pour l'IA locale sans savoir jusqu'où j'irai | Configuration budget, ou intermédiaire pour la marge |
| J'exécute des modèles 14B en permanence et je les veux instantanés | Configuration intermédiaire (env. 2 550 €) |
| Je fais du travail léger en 22B-33B et je veux une machine durable | Configuration intermédiaire (env. 2 550 €) |
| J'exécute intensivement des modèles 33B ou je veux une forte marge d'avenir | Configuration enthousiaste (env. 5 300 €) |
| J'ai besoin d'une machine mono-GPU qui exécute des modèles 70B en Q4 | Configuration enthousiaste (env. 5 300 €) |
| Je veux contenir le total malgré la hausse de 2026 | N'importe quel niveau — achetez le GPU d'occasion |
| Je suis indécis et je veux la configuration la plus sûre à garder des années | Configuration intermédiaire — le choix de la rédaction |
Configuration budget (env. 1 250 €) : RTX 4060 Ti 16 GB
La configuration budget est le PC complet pour IA locale le moins cher et exécute chaque modèle 7B ainsi que la plupart des 13B — assez de capacité pour la plupart des nouveaux venus. Elle est bâtie autour de la RTX 4060 Ti 16 GB, le GPU le moins gonflé par la hausse de 2026, ce qui maintient le total raisonnable.
- GPU — RTX 4060 Ti 16 GB (env. 470-560 €) : 16 GB de VRAM, 165 W. Exécute les modèles 7B à environ 20-25 tok/s et accueille les modèles 14B avec de la marge de contexte. La capacité de 16 GB est la raison de la préférer à la version 8 GB.
- Processeur — AMD Ryzen 7 7700 (env. 230-270 €) : 8 cœurs, consommation modeste. Le processeur travaille peu pendant l'inférence GPU, donc une puce de milieu de gamme est correcte ici — ne dépensez pas trop pour le processeur à ce niveau.
- Carte mère — chipset B650 (env. 130-170 €) : prend en charge le Ryzen 7 et un seul GPU pleine taille en PCIe. Pas besoin d'une alimentation électrique haut de gamme à ce niveau.
- RAM — 32 GB DDR5 (env. 290-380 €) : assez pour le système d'exploitation, l'outillage et un modèle 7B-13B exécuté en VRAM. La RAM ne remplace pas la VRAM — 32 GB suffisent ici. La pénurie mémoire de 2026 a nettement renchéri la DDR5.
- Stockage — SSD NVMe 1 To (env. 130-190 €) : contient le système d'exploitation et plusieurs modèles (un modèle 7B Q4 fait environ 4-5 GB).
- Alimentation — 650 W 80+ Gold (env. 80-110 €) : marge confortable pour un GPU de 165 W et un processeur 8 cœurs.
- Boîtier et refroidissement — moyen-tour avec un ventirad tour (env. 80-120 €) : le niveau budget produit peu de chaleur ; le refroidissement par air suffit.
- Pourquoi monter ce niveau : coût d'entrée le plus bas, faible consommation et assez de capacité pour les modèles 7B-13B qui couvrent la conversation générale, l'aide au code et le résumé. Pourquoi l'éviter : si vous voulez déjà des modèles 14B ou plus grands, commencez par la configuration intermédiaire.
💡Tip: Achetez la RTX 4060 Ti spécifiquement dans sa version 16 GB. La version 8 GB utilise la même puce GPU et fonctionne à vitesse similaire, mais 8 GB ne peuvent pas accueillir un modèle 14B — la mémoire supplémentaire est tout l'intérêt de ce choix.
Configuration intermédiaire (env. 2 550 €) : RTX 4070 Ti Super 16 GB
La configuration intermédiaire est le choix de la rédaction — elle exécute les modèles 14B instantanément, gère le travail léger en 22B-33B et c'est le niveau que l'on monte pour garder. Elle est bâtie autour de la RTX 4070 Ti Super 16 GB, assez rapide pour que la latence de réponse cesse d'être perceptible sur les modèles de classe 14B.
- GPU — RTX 4070 Ti Super 16 GB (env. 1 300-1 450 €) : 16 GB de VRAM, 285 W. Même capacité de modèle que le niveau budget mais bien plus rapide — les modèles 7B-14B sont instantanés et le travail léger en 22B-33B est utilisable.
- Processeur — AMD Ryzen 9 7900X (env. 280-330 €) : 12 cœurs. Plus de marge que le processeur budget pour la préparation des données et l'exécution d'outils en parallèle de l'inférence.
- Carte mère — chipset B650 ou X670 (env. 180-260 €) : alimentation électrique solide pour le processeur 12 cœurs et un GPU de 285 W.
- RAM — 64 GB DDR5 (env. 560-720 €) : de la place pour le système d'exploitation, des fenêtres de contexte plus grandes et l'outillage tel qu'un pipeline RAG exécuté à côté du modèle. La pénurie mémoire de 2026 a fortement renchéri la DDR5.
- Stockage — SSD NVMe 2 To (env. 230-310 €) : contient une bibliothèque de modèles conséquente — un modèle 33B Q4 fait environ 18-20 GB.
- Alimentation — 850 W 80+ Gold (env. 120-160 €) : marge confortable pour le GPU de 285 W et le processeur 12 cœurs sous charge soutenue.
- Boîtier et refroidissement — moyen-tour avec un AIO 240-280 mm ou un ventirad air haut de gamme (env. 150-220 €) : le niveau intermédiaire produit une chaleur modérée ; un refroidisseur de qualité maintient le processeur stable lors de longues sessions d'inférence.
- Pourquoi monter ce niveau : vous exécutez des modèles 14B en permanence et les voulez instantanés, ou vous faites du travail léger en 22B-33B et voulez de la marge. Pourquoi l'éviter : si 7B-13B suffit, la configuration budget économise plus de 1 000 € ; si vous avez besoin du 70B, aucun GPU 16 GB ne le tient — passez à l'enthousiaste.
💡Tip: La configuration intermédiaire accueille les mêmes modèles que la configuration budget — vous payez pour la vitesse, pas pour la capacité. Montez ce niveau si les modèles 14B seront une charge de travail quotidienne et que les attendre vous agacerait.
📌Note: Une RTX 4090 24 GB d'occasion se vend parfois proche du prix d'une RTX 4070 Ti Super neuve après la hausse de 2026. Si vous en trouvez une vérifiée fonctionnelle, elle ajoute 8 GB de VRAM et atteint les modèles 33B — à vérifier avant d'acheter la 4070 Ti Super.
Configuration enthousiaste (env. 5 300 €) : RTX 5090 32 GB
La configuration enthousiaste est la seule machine mono-GPU dans laquelle un modèle 70B tient en Q4 — sa RTX 5090 32 GB est la pièce maîtresse. Montez ce niveau pour la capacité de VRAM, pas pour la vitesse brute ; la vitesse est un effet secondaire. La hausse de 2026 a frappé ce niveau le plus durement, donc la ligne GPU domine et bouge d'une semaine à l'autre.
- GPU — RTX 5090 32 GB (env. 3 500-3 900 €) : 32 GB de VRAM GDDR7, 575 W. La seule carte grand public unique qui exécute un modèle 70B en Q4 sans configuration bi-GPU. Elle exécute les modèles 33B aisément, avec de la marge.
- Processeur — AMD Ryzen 9 7950X (env. 340-420 €) : 16 cœurs. Assez pour exécuter la préparation des données, les expériences de fine-tuning et l'outillage en parallèle d'une inférence intensive.
- Carte mère — chipset X670E (env. 280-380 €) : alimentation électrique robuste et PCIe 5.0, dimensionnées pour un GPU de 575 W et le processeur 16 cœurs.
- RAM — 128 GB DDR5 (env. 1 100-1 400 €) : de la place pour de grandes fenêtres de contexte, plusieurs modèles chargés à la fois et l'outillage — et la marge pour décharger partiellement un modèle vers la RAM si besoin. La pénurie mémoire de 2026 a fortement renchéri la DDR5.
- Stockage — SSD NVMe 4 To (env. 450-600 €) : un modèle 70B Q4 fait environ 40 GB ; un disque de 4 To contient une grande bibliothèque de grands modèles.
- Alimentation — 1000 W 80+ Platinum (env. 180-240 €) : nécessaire car la RTX 5090 consomme 575 W à elle seule — un bloc de 750 W s'effondrerait sous charge. Ne sous-dimensionnez pas cette pièce.
- Boîtier et refroidissement — grand boîtier avec un AIO 360 mm (env. 280-380 €) : le GPU de 575 W et le processeur 16 cœurs produisent une vraie chaleur ; un refroidissement liquide 360 mm maintient le processeur stable lors d'une inférence 70B soutenue.
- Pourquoi monter ce niveau : vous avez besoin de modèles 33B ou 70B, vous exécutez une inférence par lots intensive ou vous voulez une machine qui n'aura pas besoin d'être remplacée pendant des années. Pourquoi l'éviter : pour des modèles 7B-14B, c'est surdimensionné — la configuration intermédiaire offre des réponses instantanées sur ces tailles pour moins de la moitié du coût.
⚠️Warning: La RTX 5090 consomme 575 W à elle seule. Associez-la à l'alimentation 1000 W de cette liste de pièces — un bloc plus petit chuterait sous charge. Vérifiez que votre circuit électrique mural peut fournir la consommation totale avant de monter.
📌Note: Un modèle 70B en Q4 nécessite environ 39-42 GB de VRAM, donc même la RTX 5090 32 GB n'exécute le 70B en Q4 qu'avec une quantification agressive ou un déchargement partiel vers la RAM système. Les 128 GB de RAM de cette configuration donnent à ce déchargement la place nécessaire.
Comment la hausse des prix de 2026 modifie le calcul
La pénurie de puces mémoire de 2026 a poussé les prix des GPU à 1,5-2 fois au-dessus du tarif conseillé et, comme le GPU est la plus grande ligne de chaque configuration, elle a relevé chaque total par rapport à l'an dernier. Planifiez la configuration autour des prix actuels, pas des prix de lancement.
📍 En une phrase
La pénurie mémoire de 2026 a poussé les prix des GPU à 1,5-2 fois le tarif conseillé, relevant le total de chaque configuration pour IA locale parce que le GPU est la plus grande ligne unique de la liste de pièces.
💬 En termes simples
Le GPU est la pièce la plus chère de la machine, et en 2026 le GPU est la pièce qui a renchéri. Tant que la pénurie mémoire ne s'apaise pas, considérez les prix de lancement comme de l'histoire ancienne, achetez le GPU d'occasion quand vous le pouvez et n'achetez pas plus de VRAM que ce dont votre modèle a besoin.
- Le GPU domine le total. Dans les trois niveaux, le GPU est le coût unique le plus élevé — la hausse modifie le total de la configuration plus que toute autre pièce.
- La cause est la mémoire, pas les GPU. Une pénurie d'approvisionnement en mémoire GDDR et HBM a renchéri chaque carte dotée de mémoire rapide ; plus la VRAM est élevée, plus la carte a été touchée. La RTX 5090 est passée d'un prix de lancement d'environ 2 300 € à env. 3 500-3 900 €.
- Les GPU d'entrée de gamme ont mieux tenu. La RTX 4060 Ti 16 GB reste proche de son tarif conseillé, ce qui explique que le total de la configuration budget ait le moins bougé.
- Les GPU d'occasion sont le bon plan. Une RTX 4060 Ti ou une RTX 4090 d'occasion échappe à l'essentiel de la hausse — acheter une carte d'occasion vérifiée fonctionnelle est le moyen le plus simple de réduire le total.
- Les pièces hors GPU ont moins bougé. Les prix du processeur, de la carte mère et de l'alimentation ont augmenté modérément ; la RAM DDR5 et les SSD NVMe se sont eux aussi nettement renchéris avec la pénurie mémoire, mais le GPU reste la ligne à surveiller.
Logigramme de décision : choisissez votre configuration en quatre questions
Quatre questions, dans l'ordre, orientent la plupart des monteurs vers un niveau.
📍 En une phrase
Choisissez une configuration PC pour IA locale en répondant d'abord à la plus grande taille de modèle, ensuite au plafond de budget, puis à neuf ou d'occasion pour le GPU et enfin à la planification d'alimentation et d'espace.
💬 En termes simples
Commencez par le plus grand modèle que vous voulez réellement exécuter et laissez-le fixer votre niveau. Vérifiez ensuite votre budget, décidez d'acheter ou non le GPU d'occasion et confirmez que l'alimentation et le boîtier conviennent aux pièces. Procéder dans cet ordre évite une configuration incapable d'exécuter votre modèle.
- 1. Quel est le plus grand modèle que vous voulez exécuter ? 7B-13B : configuration budget. 14B-33B : configuration intermédiaire. 70B : configuration enthousiaste.
- 2. Quel est votre plafond de budget ferme ? Environ 1 250 € : configuration budget. Environ 2 550 € : configuration intermédiaire. Environ 5 300 € : configuration enthousiaste.
- 3. GPU neuf ou d'occasion ? Un GPU d'occasion vérifié fonctionnel échappe à l'essentiel de la hausse de 2026 — choisissez l'occasion pour abaisser le total de n'importe quel niveau.
- 4. Votre plan d'alimentation et d'espace tient-il ? Vérifiez que l'alimentation correspond au niveau (650 W / 850 W / 1000 W) et que le boîtier accueille le GPU et le refroidisseur avant de commander les pièces.
Où acheter les composants
Les grandes enseignes proposent chaque pièce de ces configurations ; le marché de l'occasion est la source du bon plan spécifiquement pour le GPU. Les liens ci-dessous sont de simples liens de recherche de produits ; ils ne portent aucune balise affiliée et ne génèrent aucune commission.
- Amazon et Newegg : le plus large stock de processeurs, RAM, SSD, alimentations et boîtiers. Le stock de GPU neufs est plus mince et affiché au niveau de la hausse de 2026.
- Marché du GPU d'occasion : le meilleur rapport qualité-prix pour la ligne GPU — une RTX 4060 Ti, une RTX 4070 Ti Super ou une RTX 4090 d'occasion vérifiée fonctionnelle échappe à l'essentiel de la hausse.
- LDLC et Materiel.net (France) : sources fiables pour les processeurs, cartes mères et alimentations, et utiles aussi pour les offres groupées processeur-plus-carte-mère.
- Achetez le GPU en premier. C'est la ligne la plus grande et la plus volatile — verrouillez le GPU à un prix que vous acceptez, puis achetez les pièces de soutien autour de lui.
⚠️Warning: En raison de la hausse des prix des GPU en 2026, chaque total de ce guide est un instantané de mai 2026 qui évolue vite. Ouvrez toujours l'annonce actuelle du revendeur pour le GPU avant de monter — son prix a bougé d'une semaine à l'autre et il domine le coût de la configuration.
Erreurs fréquentes lors du montage d'un PC pour IA locale
- Choisir le processeur avant le GPU. Le GPU décide des modèles que la machine exécute ; le processeur travaille peu pendant l'inférence. Choisissez d'abord le GPU, puis dimensionnez le processeur pour le soutenir.
- Acheter de la mémoire système au lieu de la VRAM. La RAM permet à un modèle de déborder de la VRAM, mais un modèle exécuté depuis la RAM est trop lent pour un usage interactif. Achetez assez de VRAM pour le modèle ; achetez de la RAM uniquement pour le système d'exploitation et l'outillage.
- Sous-dimensionner l'alimentation. La seule RTX 5090 consomme 575 W. Une alimentation qui chute sous charge est pire qu'un GPU plus lent mais stable — adaptez l'alimentation au niveau.
- S'ancrer sur le tarif conseillé du GPU. La hausse de 2026 fait que les prix de lancement ne reflètent plus la réalité. Budgétez le GPU par rapport au prix revendeur en direct et envisagez le marché de l'occasion.
- Acheter la RTX 4060 Ti 8 GB pour la configuration budget. Elle partage un nom avec la version 16 GB mais ne peut pas accueillir un modèle 14B. Confirmez la variante 16 GB dans l'annonce.
- Surdimensionner pour des modèles 7B. Si les modèles 7B couvrent votre cas d'usage, la configuration enthousiaste gaspille des milliers d'euros et des centaines de watts. Adaptez le niveau au modèle, pas au budget dont vous disposez par hasard.
- Négliger la planification du boîtier et du refroidissement. Un GPU de 575 W plus un processeur 16 cœurs produisent une vraie chaleur. Confirmez que le boîtier accueille le GPU et le refroidisseur et dispose d'un flux d'air avant de commander les pièces.
Sources
- Meilleur guide d'achat de GPU pour LLM locaux 2026 — PromptQuorum : prix des GPU de mai 2026 et hausse de 1,5-2 fois au-dessus du tarif conseillé, utilisés ici pour les totaux des configurations.
- Monter une station de travail LLM locale — PromptQuorum : liste de pièces, refroidissement et conseils d'alimentation pour une station 70B bi-GPU au-delà du niveau enthousiaste.
- Spécifications des séries NVIDIA GeForce RTX 40 et 50 — Capacité de VRAM et puissance (TGP) officielles pour les RTX 4060 Ti, 4070 Ti Super et 5090.
- PCPartPicker — Tarifs de composants en direct pour les processeurs AMD Ryzen, la RAM DDR5, les SSD NVMe et les alimentations en mai 2026.
FAQ
Combien coûte le montage d'un PC pour IA locale en 2026 ?
Un PC budget pour IA locale coûte environ 1 250 €, une configuration intermédiaire environ 2 550 € et une configuration enthousiaste 70B environ 5 300 €. Ce sont des instantanés de mai 2026 — la pénurie de puces mémoire de 2026 a poussé les prix des GPU à 1,5-2 fois au-dessus du tarif conseillé et, comme le GPU est la plus grande ligne de chaque configuration, elle a relevé chaque total par rapport aux mêmes pièces il y a un an.
Quel GPU mettre dans une configuration PC pour IA locale ?
Choisissez le GPU selon votre plus grand modèle visé. Une RTX 4060 Ti 16 GB convient à une configuration budget pour les modèles 7B-13B, une RTX 4070 Ti Super 16 GB à une configuration intermédiaire pour les modèles 14B-33B et une RTX 5090 32 GB à une configuration enthousiaste pour le travail 70B. Le GPU décide des modèles que la machine peut exécuter, il se choisit donc en premier et le reste de la liste de pièces se construit autour de lui.
De combien de RAM ai-je besoin pour un PC dédié à l'IA locale ?
Prévoyez 32 GB pour une configuration budget, 64 GB pour une intermédiaire et 128 GB pour une enthousiaste. La mémoire système ne remplace pas la VRAM — un modèle exécuté depuis la RAM est trop lent pour un usage interactif. La RAM sert au système d'exploitation, au contexte et à l'outillage ; achetez assez de VRAM sur le GPU pour le modèle lui-même.
Quelle alimentation faut-il pour un PC dédié à l'IA locale ?
Adaptez l'alimentation au niveau : 650 W pour la configuration budget, 850 W pour l'intermédiaire et 1000 W pour l'enthousiaste. Le niveau enthousiaste exige 1000 W car la RTX 5090 consomme 575 W à elle seule. Une alimentation sous-dimensionnée cause de l'instabilité sous charge, donc ne rognez pas sur cette pièce.
Faut-il acheter les composants GPU neufs ou d'occasion en 2026 ?
Achetez le GPU d'occasion quand vous le pouvez et les autres pièces neuves. La hausse de 2026 a poussé les prix des GPU neufs à 1,5-2 fois au-dessus du tarif conseillé, mais le marché de l'occasion y a largement échappé — une RTX 4060 Ti, une RTX 4070 Ti Super ou une RTX 4090 d'occasion vérifiée fonctionnelle réduit nettement le total. Les processeurs, la RAM, les SSD et les alimentations s'achètent de préférence neufs.
Une configuration mono-GPU peut-elle exécuter un modèle 70B ?
Oui, la configuration enthousiaste le peut. Une RTX 5090 32 GB est la seule carte grand public unique dans laquelle un modèle 70B tient en Q4, ce qui nécessite environ 39-42 GB de VRAM — elle exécute donc le 70B avec une quantification agressive ou un déchargement partiel vers la RAM système. Les 128 GB de RAM de la configuration enthousiaste donnent à ce déchargement la place nécessaire.
La configuration intermédiaire vaut-elle le surcoût par rapport à la budget ?
Oui, si vous exécutez régulièrement des modèles de classe 14B. Les configurations budget et intermédiaire accueillent des modèles similaires, mais la RTX 4070 Ti Super de l'intermédiaire est bien plus rapide — les modèles 14B deviennent instantanés au lieu d'être lents, et le travail léger en 22B-33B devient utilisable. Si votre plafond est fermement les modèles 7B-13B, la configuration budget économise plus de 1 000 € et offre un meilleur rapport qualité-prix.
Faut-il un processeur Threadripper pour un PC dédié à l'IA locale ?
Non. Un processeur Ryzen grand public suffit pour les trois configurations de ce guide — un Ryzen 7 pour le niveau budget, un Ryzen 9 pour les niveaux intermédiaire et enthousiaste. Un Threadripper ne vaut son coût que pour une machine bi-GPU qui exécute le fine-tuning et l'inférence en même temps, ce qui dépasse une configuration mono-GPU.