Wichtigste Erkenntnisse
- Home Assistant hat eine integrierte Ollama-Anbindung; ein lokales Modell wird zum Konversations-Agent
- Sie steuern Geräte in natürlicher Sprache, statt exakte Befehlsphrasen zu merken
- Das Modell kann kontextbewusste Automatisierungen ausführen, die starre Regeln nicht ausdrücken
- Alles läuft auf eigener Hardware – keine Cloud, keine Nutzungsdaten, die das Haus verlassen
- Ein kleines Function-Calling-Modell auf einem Mini-PC genügt; eine GPU oder leistungsfähige iGPU/NPU senkt die Latenz
- Reihenfolge: erst Home Assistant, dann Ollama, dann den Konversations-Agent verbinden, dann lokale Sprache ergänzen
Was es bedeutet, das Smart Home mit einem lokalen LLM zu betreiben
Es bedeutet, dass ein lokal gehostetes Sprachmodell zwischen Ihnen und Ihren Geräten sitzt, natürlichsprachliche Absichten in Home-Assistant-Aktionen übersetzt und Automatisierungsentscheidungen trifft, die eine feste Regel nicht treffen könnte. Das LLM spielt zwei Rollen: Konversations-Agent (Sie sprechen, es handelt) und Automatisierungs-Gehirn (es schließt über den Kontext).
- Konversations-Agent: Sie sagen oder tippen „Mach das Wohnzimmer gemütlich", und das Modell ordnet diese Absicht konkreten Geräteaufrufen zu – Licht dimmen, warme Farbe einstellen, Rollos herunterfahren.
- Automatisierungs-Gehirn: Statt ein Auslöser → eine Aktion kann das Modell den Kontext abwägen: Tageszeit, wer zu Hause ist, Sensorzustände und ein natürlichsprachliches Ziel.
- Lokal von Grund auf: Das Modell läuft über Ollama auf Ihrem eigenen Rechner, sodass weder Ihre Befehle noch Ihr Heimzustand an Dritte gesendet werden.
Warum es 2026 funktioniert
Drei Dinge kamen zusammen: Kleine Modelle wurden leistungsfähig genug für die Heimsteuerung, sie erhielten zuverlässiges Function-Calling, und Home Assistant lieferte eine erstklassige LLM-Anbindung. Keines davon existierte bis vor wenigen Jahren gemeinsam für Privatanwender.
- Leistungsfähige kleine Modelle: Modelle im Bereich 3B–8B folgen Anweisungen jetzt gut genug, um Absicht in Geräteaktionen zu übersetzen, und passen auf bescheidene Hardware. Zur Modellmechanik und Größenwahl siehe was lokale LLMs sind – dieser Leitfaden erklärt sie nicht erneut.
- Function-Calling / Tool-Nutzung: Die Heimsteuerung hängt davon ab, dass das Modell strukturierte Aufrufe ausgibt (einschalten, Temperatur setzen). Moderne lokale Modelle unterstützen das, was zuverlässige Steuerung erst möglich macht.
- Home-Assistant-Anbindung: Home Assistant stellt eine Konversations-Agent-Schnittstelle und eine Ollama-Anbindung bereit, sodass das Verbinden eines lokalen Modells mit Ihren Geräten ein Konfigurationsschritt ist, kein Eigenbau.
Die Architektur: Home Assistant + Ollama + lokale Sprache
Der Stack besteht aus drei Komponenten auf eigener Hardware: Home Assistant (Geräte + Automatisierungen), Ollama (die lokale Modell-Laufzeit) und eine lokale Sprach-Pipeline (Assist + Whisper + Piper). Die Daten fließen in einer Schleife, die das Netzwerk nie verlässt.
- 1Home Assistant
Why it matters: Verwaltet Ihre Geräte, Entitätszustände und Automatisierungen und stellt die Konversations-Agent-Schnittstelle bereit. Es ist der Hub, über den das Modell handelt – beginnen Sie bei [Home Assistant: Erste Schritte](/de/smart-home/home-assistant-getting-started). - 2Ollama
Why it matters: Betreibt das lokale Modell und stellt es Home Assistant bereit. Zur Installation und Modellwahl verweisen wir auf [Ollama installieren](/de/local-llms/how-to-install-ollama); dieser Leitfaden bleibt bei der Smart-Home-Verkabelung. - 3Konversations-Agent
Why it matters: Die Home-Assistant-Einstellung, die Assist auf das Ollama-Modell richtet, sodass natürliche Sprache zu Geräteaktionen wird – die Schritt-für-Schritt-Anleitung steht in [Ollama mit Home Assistant verbinden](/de/smart-home/home-assistant-ollama-integration). - 4Lokale Sprache (optional)
Why it matters: Whisper transkribiert Sprache und Piper spricht Antworten, sodass Sie einen vollständig offline arbeitenden Sprachassistenten erhalten – siehe [einen vollständig lokalen Sprachassistenten bauen](/de/smart-home/local-voice-assistant-smart-home).
Was es gegenüber regelbasierter Automatisierung freischaltet
Ein lokales LLM bringt Flexibilität, natürliche Sprache und Kontext, die regelbasierte Automatisierung nicht ausdrücken kann – im Tausch gegen mehr Einrichtung und Hardware. Nutzen Sie Regeln für deterministische Auslöser; das LLM dort, wo Absicht und Kontext zählen.
- Konkrete Automatisierungsbeispiele und die zugehörigen Prompts finden Sie unter smartere Automatisierungen mit einem lokalen LLM.
- Behalten Sie deterministische Sicherheitsautomatisierungen (Rauchmelder, Türschlösser) als einfache Regeln – leiten Sie sie nicht durch das Modell.
| Aspekt | Regelbasierte Automatisierung | Lokale-LLM-Automatisierung |
|---|---|---|
| Flexibilität | Fester Auslöser → feste Aktion | Interpretiert Ziele und passt sich dem Kontext an |
| Natürliche Sprache | Keine – Sie verdrahten exakte Bedingungen | Natürlichsprachliche Befehle und Absichten |
| Kontextbewusstsein | Nur die Zustände, die Sie skripten | Schließt über Zeit, Anwesenheit, Sensoren |
| Einrichtung | Einfach pro Regel | Höher – Hub + Modell + Verkabelung |
| Hardwarebedarf | Minimal (ein Pi) | Ein Mini-PC; GPU/NPU hilft bei der Latenz |
Die Hardware-Realität
Sie können Home Assistant und ein kleines lokales Modell auf einem einzigen Mini-PC betreiben; eine GPU, leistungsfähige iGPU oder NPU senkt die Antwortlatenz. Dieser Leitfaden erklärt VRAM oder Modell-Quantisierung nicht erneut – dafür verweisen wir nach außen.
- Eine Box genügt: Ein Mini-PC kann Home Assistant plus ein kleines Modell über Ollama hosten. Empfehlungen siehe beste Mini-PCs für Home Assistant + lokale KI.
- Latenz skaliert mit der Hardware: Größere Modelle und reine CPU-Inferenz antworten langsamer; eine GPU oder moderne iGPU/NPU verkürzt den Abstand zu einem flotten Assistenten. Zu VRAM und Modellgröße siehe beste Hardware für ein lokales Smart Home.
- Wählen Sie das Modell für die Aufgabe: Heimsteuerung belohnt kleine, schnelle Function-Calling-Modelle gegenüber dem größten verfügbaren – siehe beste lokale LLM-Modelle für die Smart-Home-Steuerung.
Ihr Schritt-für-Schritt-Weg
Bauen Sie in dieser Reihenfolge: Home Assistant, dann Ollama, dann der Konversations-Agent, dann Sprache und Automatisierungen. Jeder Schritt ist in einer eigenen Anleitung behandelt, damit dieser Flaggschiff-Artikel eine Landkarte bleibt, keine Befehlswüste.
- 1Richten Sie Home Assistant auf einem Mini-PC ein – Erste-Schritte-Leitfaden.
- 2Installieren Sie Ollama und laden Sie ein kleines Modell – Ollama installieren.
- 3Verbinden Sie Ollama mit Home Assistant und setzen Sie es als Konversations-Agent – Anbindungs-Anleitung.
- 4Wählen Sie ein für die Heimsteuerung abgestimmtes Modell – beste lokale LLM-Modelle fürs Smart Home.
- 5Ergänzen Sie ein vollständig lokales Sprach-Frontend – lokaler Sprachassistent.
- 6Entwerfen Sie kontextbewusste Automatisierungen – KI-Automatisierungen mit einem lokalen LLM.
FAQ
Welches lokale Modell eignet sich am besten für die Heimsteuerung?
Ein kleines, anweisungsfolgendes Modell mit zuverlässigem Function-Calling – typischerweise im Bereich 3B bis 8B – passt am besten, weil die Heimsteuerung schnelle, strukturierte Antworten braucht statt des größten Modells. Die richtige Wahl hängt von Ihrer Hardware ab; siehe den Leitfaden zu den besten lokalen LLM-Modellen fürs Smart Home für aktuelle Optionen.
Brauche ich eine GPU für ein lokales LLM-Smart-Home?
Nein, aber sie hilft. Ein kleines Modell läuft auf einer modernen CPU oder leistungsfähigen integrierten GPU; eine dedizierte GPU oder NPU senkt vor allem die Antwortlatenz, sodass sich der Assistent flotter anfühlt. Passen Sie die Modellgröße an Ihre Hardware an, statt die größte GPU zu kaufen.
Funktioniert ein lokales LLM-Smart-Home offline?
Ja. Das Modell läuft lokal über Ollama, und Home Assistant steuert Geräte über Ihr LAN, sodass natürlichsprachliche Steuerung und Automatisierungen ohne Internet funktionieren. Nur der Fernzugriff von außerhalb des Hauses benötigt eine Verbindung.
Ist ein lokales LLM schneller als Alexa?
Das hängt von Hardware und Modellgröße ab. Cloud-Assistenten wie Alexa sind auf niedrige Latenz optimiert, während ein lokales LLM etwas Geschwindigkeit gegen Privatsphäre und Offline-Betrieb eintauscht; auf einem GPU-bestückten Mini-PC verringert sich der Abstand. Der entscheidende Vorteil ist Privatsphäre und Kontrolle, nicht reine Geschwindigkeit.
Kann ein lokales LLM-Smart-Home auf einem Raspberry Pi laufen?
Ein Raspberry Pi betreibt Home Assistant gut, aber LLM-Inferenz auf einem Pi ist auf sehr kleine Modelle beschränkt und langsam. Für einen reaktionsschnellen lokalen LLM-Assistenten ist ein Mini-PC mit leistungsfähiger iGPU/NPU oder einer dedizierten GPU die bessere Wahl.