Points clés
- Home Assistant dispose d'une intégration Ollama native ; un modèle local devient l'agent de conversation
- Vous commandez les appareils en langage naturel au lieu de mémoriser des phrases exactes
- Le modèle peut exécuter des automatisations contextuelles que les règles rigides ne peuvent exprimer
- Tout tourne sur votre matériel : sans cloud, aucune donnée d'usage ne quitte la maison
- Un petit modèle à function-calling sur un mini-PC suffit ; une GPU ou iGPU/NPU performante réduit la latence
- Ordre de construction : Home Assistant d'abord, puis Ollama, puis brancher l'agent de conversation, puis ajouter la voix locale
Ce que signifie faire tourner sa maison connectée sur un LLM local
Cela signifie qu'un modèle de langage hébergé localement se place entre vous et vos appareils, traduisant l'intention en langage naturel en actions Home Assistant et prenant des décisions d'automatisation qu'une règle fixe ne pourrait pas. Le LLM joue deux rôles : agent de conversation (vous parlez, il agit) et cerveau d'automatisation (il raisonne sur le contexte).
- Agent de conversation : vous dites ou tapez « rends le salon cosy » et le modèle associe cette intention à des appels d'appareils concrets — tamiser les lumières, régler une couleur chaude, baisser les stores.
- Cerveau d'automatisation : au lieu d'un déclencheur → une action, le modèle peut peser le contexte : heure de la journée, qui est à la maison, états des capteurs et un objectif en langage naturel.
- Local par conception : le modèle tourne via Ollama sur votre propre machine, donc ni vos commandes ni l'état de votre maison ne sont envoyés à un tiers.
Pourquoi ça marche en 2026
Trois choses ont convergé : les petits modèles sont devenus assez capables pour le contrôle domestique, ils ont gagné un function-calling fiable, et Home Assistant a livré une intégration LLM de premier ordre. Aucune de ces conditions n'existait ensemble pour les particuliers il y a quelques années.
- Petits modèles capables : les modèles de 3B–8B suivent désormais les instructions assez bien pour associer l'intention à des actions d'appareils, et tiennent sur du matériel modeste. Pour la mécanique et le dimensionnement, voir qu'est-ce qu'un LLM local — ce guide ne les réexplique pas.
- Function-calling / utilisation d'outils : le contrôle domestique dépend de la capacité du modèle à émettre des appels structurés (allumer, régler la température). Les modèles locaux modernes le prennent en charge, ce qui rend le contrôle fiable possible.
- Intégration Home Assistant : Home Assistant expose une interface d'agent de conversation et une intégration Ollama, donc brancher un modèle local à vos appareils est une étape de configuration, pas un développement sur mesure.
L'architecture : Home Assistant + Ollama + voix locale
Le stack, c'est trois composants sur votre propre matériel : Home Assistant (appareils + automatisations), Ollama (le runtime du modèle local) et une pipeline vocale locale (Assist + Whisper + Piper). Les données circulent en boucle, sans jamais quitter votre réseau.
- 1Home Assistant
Why it matters: Gère vos appareils, états d'entités et automatisations, et expose l'interface d'agent de conversation. C'est le hub par lequel le modèle agit — commencez par [Home Assistant : premiers pas](/fr/smart-home/home-assistant-getting-started). - 2Ollama
Why it matters: Exécute le modèle local et le sert à Home Assistant. Pour l'installation et le choix des modèles, voir [comment installer Ollama](/fr/local-llms/how-to-install-ollama) ; ce guide reste centré sur le câblage de la maison connectée. - 3Agent de conversation
Why it matters: Le réglage Home Assistant qui pointe Assist vers le modèle Ollama pour que le langage naturel devienne des actions d'appareils — le pas à pas est dans [connecter Ollama à Home Assistant](/fr/smart-home/home-assistant-ollama-integration). - 4Voix locale (optionnelle)
Why it matters: Whisper transcrit la parole et Piper énonce les réponses, vous obtenez donc un assistant vocal entièrement hors ligne — voir [construire un assistant vocal entièrement local](/fr/smart-home/local-voice-assistant-smart-home).
Ce que cela débloque face à l'automatisation par règles
Un LLM local apporte flexibilité, langage naturel et contexte que l'automatisation par règles ne peut exprimer — au prix de plus de configuration et de matériel. Utilisez les règles pour les déclencheurs déterministes ; le LLM là où l'intention et le contexte comptent.
- Pour des exemples concrets d'automatisation et les prompts associés, voir des automatisations plus intelligentes avec un LLM local.
- Gardez les automatisations de sécurité déterministes (détecteur de fumée, serrures) comme de simples règles — ne les faites pas passer par le modèle.
| Aspect | Automatisation par règles | Automatisation par LLM local |
|---|---|---|
| Flexibilité | Déclencheur fixe → action fixe | Interprète les objectifs et s'adapte au contexte |
| Langage naturel | Aucun — vous câblez des conditions exactes | Commandes et intentions en langage naturel |
| Conscience du contexte | Seulement les états que vous scriptez | Raisonne sur le temps, la présence, les capteurs |
| Configuration | Simple par règle | Plus élevée — hub + modèle + câblage |
| Besoin matériel | Minimal (un Pi) | Un mini-PC ; une GPU/NPU aide à la latence |
La réalité du matériel
Vous pouvez faire tourner Home Assistant et un petit modèle local sur un seul mini-PC ; une GPU, iGPU performante ou NPU réduit la latence de réponse. Ce guide ne réexplique pas la VRAM ni la quantification des modèles — pour cette profondeur, lien vers l'extérieur.
- Une seule machine suffit : un mini-PC peut héberger Home Assistant plus un petit modèle via Ollama. Pour des choix, voir meilleurs mini-PC pour Home Assistant + IA locale.
- La latence évolue avec le matériel : les modèles plus grands et l'inférence CPU seule répondent plus lentement ; une GPU ou iGPU/NPU moderne réduit l'écart vers un assistant réactif. Pour la VRAM et le dimensionnement, voir meilleur matériel pour une maison connectée locale.
- Choisissez le modèle selon la tâche : le contrôle domestique récompense les petits modèles rapides à function-calling plutôt que le plus grand disponible — voir meilleurs modèles LLM locaux pour le contrôle de la maison connectée.
Votre chemin pas à pas
Construisez dans l'ordre : Home Assistant, puis Ollama, puis l'agent de conversation, puis la voix et les automatisations. Chaque étape est traitée dans un guide dédié, pour que cet article phare reste une carte et non un mur de commandes.
- 1Configurez Home Assistant sur un mini-PC — guide de démarrage.
- 2Installez Ollama et téléchargez un petit modèle — comment installer Ollama.
- 3Connectez Ollama à Home Assistant et définissez-le comme agent de conversation — guide d'intégration.
- 4Choisissez un modèle adapté au contrôle domestique — meilleurs modèles LLM locaux pour la maison connectée.
- 5Ajoutez un frontal vocal entièrement local — assistant vocal local.
- 6Concevez des automatisations contextuelles — automatisations IA avec un LLM local.
FAQ
Quel modèle local est le meilleur pour le contrôle domestique ?
Un petit modèle suivant les instructions et doté d'un function-calling fiable — généralement entre 3B et 8B — convient le mieux, car le contrôle domestique exige des réponses rapides et structurées plutôt que le plus grand modèle. Le bon choix dépend de votre matériel ; voir le guide des meilleurs modèles LLM locaux pour la maison connectée.
Ai-je besoin d'une GPU pour une maison connectée à LLM local ?
Non, mais elle aide. Un petit modèle tourne sur un CPU moderne ou une GPU intégrée performante ; une GPU dédiée ou NPU réduit surtout la latence de réponse pour un assistant plus réactif. Adaptez la taille du modèle à votre matériel.
Une maison connectée à LLM local fonctionne-t-elle hors ligne ?
Oui. Le modèle tourne localement via Ollama et Home Assistant contrôle les appareils via votre LAN, donc la commande en langage naturel et les automatisations fonctionnent sans internet. Seul l'accès à distance hors de la maison nécessite une connexion.
Un LLM local est-il plus rapide qu'Alexa ?
Cela dépend du matériel et de la taille du modèle. Les assistants cloud comme Alexa sont optimisés pour une faible latence, tandis qu'un LLM local échange un peu de vitesse contre la confidentialité et le fonctionnement hors ligne ; sur un mini-PC équipé d'une GPU, l'écart se réduit. L'avantage décisif est la confidentialité et le contrôle, pas la vitesse brute.
Une maison connectée à LLM local peut-elle tourner sur un Raspberry Pi ?
Un Raspberry Pi fait bien tourner Home Assistant, mais l'inférence LLM sur un Pi se limite à de très petits modèles et reste lente. Pour un assistant à LLM local réactif, un mini-PC avec iGPU/NPU performante ou une GPU dédiée est le meilleur choix.