Wichtigste Erkenntnisse
- Heimsteuerung belohnt niedrige Latenz und zuverlässiges Function-Calling, nicht maximale Modellgröße
- Ein 4B-Modell passt zu stromsparender Hardware; ein 8B-Modell zu einem Mini-PC mit GPU oder NPU
- Gemma 3 4B (Google), Qwen3 4B (Alibaba) und Qwen3 8B (Alibaba) sind verbreitete, gut unterstützte Wahlen
- Qwen3, Gemma 3 und Phi-4-mini haben heute nachgewiesene Home-Assistant-Tool-Calling-Unterstützung
- Wählen Sie ein Modell mit starker Unterstützung für die Sprache, die Sie damit sprechen
- Für tiefe Modell-Rankings und -Mechanik verlinken Sie auf den local-llms-Cluster
Was für die Heimsteuerung zählt
Drei Dinge entscheiden über ein gutes Heimsteuerungs-Modell: Latenz, zuverlässiges Function-Calling und eine zu Ihrer Hardware passende Größe. Benchmark-Bestenlisten zählen hier weit weniger als Reaktionsfähigkeit.
- Latenz: Ein Sprachbefehl sollte sich nahezu sofort anfühlen; kleinere Modelle auf fähiger Hardware antworten schneller.
- Function-Calling: Das Modell muss zuverlässig strukturierte Geräteaktionen ausgeben – das ist die entscheidende Fähigkeit.
- Passung: Das Modell muss bequem auf dem Gerät laufen, das auch Home Assistant hostet – siehe beste Hardware für ein lokales Smart Home.
Die Auswahl
Diese kleinen Modelle sind verbreitete, gut unterstützte Wahlen für die Heimsteuerung über verschiedene Hardware-Budgets hinweg. Nutzen Sie ein 4B-Modell auf leichter Hardware und ein 8B-Modell, wenn Sie eine GPU oder NPU haben. Gemma 4 (Juni 2026) ist die neueste Option; Qwen3, Gemma 3 und Phi-4-mini haben heute nachgewiesene Home-Assistant-Tool-Calling-Unterstützung.
- Gemma 3 4B (Google): ein Modell mit 4 Milliarden Parametern mit breiter Mehrsprachigkeit (über 140 Sprachen), eine starke stromsparende Wahl – Ollama-Tag
gemma3:4b. - Qwen3 4B (Alibaba): ein schnelles 4B-Modell mit zuverlässigem Tool-Einsatz und guter Mehrsprachigkeit, niedrige Latenz auf einer CPU oder integrierten GPU –
qwen3:4b. - Phi-4-mini (Microsoft): ein kompaktes 3,8B-Modell, das beim Instruktionsfolgen über seiner Größe spielt –
phi4-mini. - Llama 3.2 3B (Meta): eine breit unterstützte 3B-Basis, die auf bescheidener Hardware mit gutem Function-Calling läuft –
llama3.2:3b. - Qwen3 8B (Alibaba): hier die beste Qualität auf einer GPU oder NPU und ein Home-Assistant-Favorit für Tool-Calling –
qwen3:8b.
Vergleich
Wählen Sie nach Hardware und Sprache: kleinere Modelle für reine CPU- oder Pi-Klasse-Hardware, 8B für einen Mini-PC mit GPU. Die Größen unten sind ungefähr bei üblicher 4-Bit-Quantisierung; der Ollama-Tag ist das exakte Modell zum Laden.
- Die Bedarfe sind ungefähr und hängen von der Quantisierung ab – für VRAM und Quantisierungs-Tiefe verlinken Sie auf den local-llms-Cluster.
| Modell | Parameter | Ungef. Bedarf (Q4) | Ollama-Tag | Am besten für |
|---|---|---|---|---|
| Gemma 3 4B | 4B | ~3 GB | gemma3:4b | Stromsparender Host, über 140 Sprachen |
| Qwen3 4B | 4B | ~2,5–3 GB | qwen3:4b | Niedrige Latenz, mehrsprachig, Tools |
| Phi-4-mini | 3.8B | ~2,5–3 GB | phi4-mini | Starkes Instruktionsfolgen |
| Llama 3.2 3B | 3B | ~2–3 GB | llama3.2:3b | Breit unterstützte Basis |
| Qwen3 8B | 8B | ~5 GB | qwen3:8b | Beste Qualität auf GPU/NPU; HA-Favorit |
Empfehlungen nach Hardware-Budget
Wählen Sie ein 4B-Modell auf einem Pi oder reinen CPU-Mini-PC; wählen Sie ein 8B-Modell, wenn Sie eine GPU oder NPU haben. Das hält Antworten auf jeder Stufe flott.
- Raspberry Pi / stromsparend: Gemma 3 4B oder Qwen3 4B, langsamere Antworten in Kauf nehmend.
- Mini-PC (nur CPU): Qwen3 4B oder Phi-4-mini als reaktionsschneller Standard.
- Mini-PC mit GPU/NPU: Qwen3 8B für die beste Qualität bei akzeptabler Latenz – siehe beste Mini-PCs für Home Assistant + lokale KI.
Wie man wählt
Beginnen Sie mit einem 4B-Modell, bestätigen Sie Latenz und zuverlässige Geräteaktionen, und wechseln Sie nur zu 8B, wenn die Qualität fehlt. Testen Sie mit Ihren echten Befehlen, bevor Sie sich festlegen.
- Installieren Sie über die Ollama-Anbindung und testen Sie Ihre üblichen Befehle.
- Sind die Antworten langsam, gehen Sie eine Größe herunter oder fügen Sie eine GPU/NPU hinzu.
- Sind die Aktionen unzuverlässig, bevorzugen Sie ein Modell, das für Function-Calling bekannt ist.
- Für tiefe Modell-Rankings und -Mechanik siehe beste lokale LLMs 2026 (clusterübergreifend) – dieser Leitfaden bleibt heimsteuerungsspezifisch.
FAQ
Was ist das kleinste nutzbare Modell für die Heimsteuerung?
Ein 3B-Modell wie Llama 3.2 3B ist die praktische Untergrenze für zuverlässige Gerätesteuerung auf stromsparender Hardware und tauscht etwas Verständnis gegen Tempo. Ein 4B-Modell wie Gemma 3 4B oder Qwen3 4B ist die bessere Balance, wenn Ihre Hardware es erlaubt.
Braucht ein Heimsteuerungs-Modell eine GPU?
Nein für 4B-Modelle, die auf CPU oder einer integrierten GPU laufen. Eine GPU oder NPU lässt Sie vor allem ein 8B-Modell wie Qwen3 8B bei niedriger Latenz für besseres Verständnis betreiben. Passen Sie das Modell an Ihre Hardware an.
Welche Modelle unterstützen Function-Calling?
Moderne kleine Modelle wie Qwen3, Gemma 3 und Phi-4-mini haben nachgewiesene Home-Assistant-Tool-/Function-Calling-Unterstützung, die Fähigkeit, mit der sie zuverlässige Geräteaktionen ausgeben. Bevorzugen Sie für die Heimsteuerung ein Modell, das dies dokumentiert unterstützt.
Was ist das beste Modell für einen Raspberry Pi?
Ein 4B-Modell wie Gemma 3 4B oder Qwen3 4B ist die praktische Obergrenze auf einem Raspberry Pi, und die Antworten sind langsamer als auf einem Mini-PC. Für einen flotten Assistenten ist ein Mini-PC mit GPU/NPU, der Qwen3 8B betreibt, der bessere Host.