Points clés
- Le contrôle de la maison récompense la faible latence et l'appel de fonctions fiable, pas la taille maximale du modèle
- Un modèle 4B convient au matériel basse consommation ; un modèle 8B à un mini-PC avec GPU ou NPU
- Gemma 3 4B (Google), Qwen3 4B (Alibaba) et Qwen3 8B (Alibaba) sont des choix courants et bien pris en charge
- Qwen3, Gemma 3 et Phi-4-mini ont un support de tool-calling Home Assistant prouvé aujourd'hui
- Choisissez un modèle avec un solide support de la langue que vous lui parlez
- Pour des classements et une mécanique de modèles approfondis, renvoyez vers le cluster local-llms
Ce qui compte pour le contrôle de la maison
Trois choses décident d'un bon modèle de contrôle de la maison : la latence, l'appel de fonctions fiable et une taille qui correspond à votre matériel. Les classements de benchmarks comptent bien moins ici que la réactivité.
- Latence : une commande vocale doit sembler quasi instantanée ; les modèles plus petits sur du matériel capable répondent plus vite.
- Appel de fonctions : le modèle doit émettre des actions d'appareil structurées de façon fiable — c'est la capacité décisive.
- Adéquation : le modèle doit tourner confortablement sur la machine qui héberge aussi Home Assistant — voir meilleur matériel pour une maison connectée locale.
La liste restreinte
Ces petits modèles sont des choix courants et bien pris en charge pour le contrôle de la maison à travers différents budgets matériels. Utilisez un modèle 4B sur du matériel léger et un modèle 8B quand vous avez un GPU ou un NPU. Gemma 4 (juin 2026) est l'option la plus récente ; Qwen3, Gemma 3 et Phi-4-mini ont un support de tool-calling Home Assistant prouvé aujourd'hui.
- Gemma 3 4B (Google) : un modèle de 4 milliards de paramètres à large couverture multilingue (plus de 140 langues), un solide choix basse consommation — tag Ollama
gemma3:4b. - Qwen3 4B (Alibaba) : un modèle 4B rapide avec un usage d'outils fiable et un bon support multilingue, faible latence sur un CPU ou un GPU intégré —
qwen3:4b. - Phi-4-mini (Microsoft) : un modèle compact de 3,8B qui dépasse sa taille en suivi des instructions —
phi4-mini. - Llama 3.2 3B (Meta) : une base 3B largement prise en charge qui tourne sur du matériel modeste avec un bon appel de fonctions —
llama3.2:3b. - Qwen3 8B (Alibaba) : ici la meilleure qualité sur un GPU ou un NPU et un favori de Home Assistant pour le tool-calling —
qwen3:8b.
Comparaison
Choisissez par matériel et langue : des modèles plus petits pour du matériel CPU seul ou de classe Pi, 8B pour un mini-PC équipé d'un GPU. Les tailles ci-dessous sont approximatives à la quantification courante de 4 bits ; le tag Ollama est le modèle exact à télécharger.
- Les empreintes sont approximatives et dépendent de la quantification — pour la VRAM et la profondeur de quantification, renvoyez vers le cluster local-llms.
| Modèle | Paramètres | Empreinte approx. (Q4) | Tag Ollama | Idéal pour |
|---|---|---|---|---|
| Gemma 3 4B | 4B | ~3 Go | gemma3:4b | Hôte basse consommation, plus de 140 langues |
| Qwen3 4B | 4B | ~2,5–3 Go | qwen3:4b | Faible latence, multilingue, outils |
| Phi-4-mini | 3.8B | ~2,5–3 Go | phi4-mini | Fort suivi des instructions |
| Llama 3.2 3B | 3B | ~2–3 Go | llama3.2:3b | Base largement prise en charge |
| Qwen3 8B | 8B | ~5 Go | qwen3:8b | Meilleure qualité sur GPU/NPU ; favori de HA |
Choix par budget matériel
Choisissez un modèle 4B sur une Pi ou un mini-PC CPU seul ; choisissez un modèle 8B quand vous avez un GPU ou un NPU. Cela garde les réponses vives à chaque niveau.
- Raspberry Pi / basse consommation : Gemma 3 4B ou Qwen3 4B, en acceptant des réponses plus lentes.
- Mini-PC (CPU seul) : Qwen3 4B ou Phi-4-mini comme choix par défaut réactif.
- Mini-PC avec GPU/NPU : Qwen3 8B pour la meilleure qualité à une latence acceptable — voir meilleurs mini-PC pour Home Assistant + IA locale.
Comment choisir
Commencez par un modèle 4B, confirmez la latence et des actions d'appareil fiables, puis passez à 8B seulement si la qualité manque. Testez avec vos vraies commandes avant de vous engager.
- Installez via l'intégration Ollama et testez vos commandes courantes.
- Si les réponses sont lentes, descendez d'une taille ou ajoutez un GPU/NPU.
- Si les actions ne sont pas fiables, préférez un modèle connu pour l'appel de fonctions.
- Pour des classements et une mécanique de modèles approfondis, voir meilleurs LLM locaux 2026 (inter-clusters) — ce guide reste spécifique au contrôle de la maison.
FAQ
Quel est le plus petit modèle utilisable pour le contrôle de la maison ?
Un modèle 3B comme Llama 3.2 3B est le plancher pratique pour un contrôle d'appareils fiable sur du matériel basse consommation, échangeant un peu de compréhension contre de la vitesse. Un modèle 4B comme Gemma 3 4B ou Qwen3 4B est un meilleur équilibre si votre matériel le permet.
Un modèle de contrôle de la maison a-t-il besoin d'un GPU ?
Non pour les modèles 4B, qui tournent sur CPU ou un GPU intégré. Un GPU ou un NPU vous permet surtout d'exécuter un modèle 8B comme Qwen3 8B à faible latence pour une meilleure compréhension. Adaptez le modèle à votre matériel.
Quels modèles prennent en charge l'appel de fonctions ?
Les petits modèles modernes dont Qwen3, Gemma 3 et Phi-4-mini ont un support de tool/function-calling Home Assistant prouvé, la capacité qui leur permet d'émettre des actions d'appareil fiables. Préférez un modèle documenté pour la prendre en charge pour le contrôle de la maison.
Quel est le meilleur modèle pour une Raspberry Pi ?
Un modèle 4B comme Gemma 3 4B ou Qwen3 4B est le plafond pratique sur une Raspberry Pi, et les réponses seront plus lentes que sur un mini-PC. Pour un assistant vif, un mini-PC avec GPU/NPU exécutant Qwen3 8B est le meilleur hôte.