关键要点
- Home Assistant 内置 Ollama 集成;本地模型成为对话代理
- 你用自然语言控制设备,而不必记住精确的指令短语
- 模型可执行僵硬规则无法表达的情境化自动化
- 一切都在你的硬件上运行:无云端,使用数据不出家门
- 迷你 PC 上的小型函数调用模型即可;GPU 或强力 iGPU/NPU 可降低延迟
- 搭建顺序:先 Home Assistant,再 Ollama,然后连接对话代理,最后添加本地语音
用本地LLM运行智能家居究竟意味着什么
它意味着一个本地托管的语言模型位于你和设备之间,把自然语言意图翻译成 Home Assistant 的操作,并做出固定规则无法做出的自动化决策。 LLM 担当两个角色:对话代理(你说,它做)和自动化大脑(基于情境推理)。
- 对话代理: 你说或输入“把客厅弄得温馨些”,模型就把该意图映射为具体的设备调用——调暗灯光、设为暖色、放下百叶窗。
- 自动化大脑: 不是一个触发→一个动作,模型能权衡情境:时间、谁在家、传感器状态,以及一个自然语言目标。
- 从设计上本地化: 模型通过 Ollama 在你自己的机器上运行,因此你的指令和家中状态都不会发给第三方。
为何在2026可行
三件事汇合了:小型模型变得足以胜任家庭控制,获得了可靠的函数调用,Home Assistant 推出了一流的 LLM 集成。 这些条件几年前对家庭用户还不曾同时具备。
- 能干的小型模型: 3B–8B 的模型如今足以遵循指令,把意图映射为设备操作,并能装进普通硬件。模型机制与规模选择见什么是本地LLM——本指南不再赘述。
- 函数调用 / 工具使用: 家庭控制依赖模型输出结构化调用(开启、设温)。现代本地模型支持这一点,这正是可靠控制成为可能的原因。
- Home Assistant 集成: Home Assistant 暴露对话代理接口和 Ollama 集成,因此把本地模型接到你的设备只是一步配置,而非定制开发。
架构:Home Assistant + Ollama + 本地语音
这套堆栈是你自有硬件上的三个组件:Home Assistant(设备 + 自动化)、Ollama(本地模型运行时)和本地语音管线(Assist + Whisper + Piper)。 数据在一个永不离开你网络的回路中流动。
- 1Home Assistant
Why it matters: 管理你的设备、实体状态和自动化,并暴露对话代理接口。它是模型据以行动的中枢——从[Home Assistant 入门](/zh/smart-home/home-assistant-getting-started)开始。 - 2Ollama
Why it matters: 运行本地模型并提供给 Home Assistant。安装与模型选择见[如何安装 Ollama](/zh/local-llms/how-to-install-ollama);本指南专注于智能家居的接线。 - 3对话代理
Why it matters: Home Assistant 中把 Assist 指向 Ollama 模型的设置,使自然语言变为设备操作——分步说明见[把 Ollama 连接到 Home Assistant](/zh/smart-home/home-assistant-ollama-integration)。 - 4本地语音(可选)
Why it matters: Whisper 转写语音,Piper 朗读回复,于是你获得一个完全离线的语音助手——参见[搭建完全本地的语音助手](/zh/smart-home/local-voice-assistant-smart-home)。
相对基于规则的自动化它解锁了什么
本地LLM带来基于规则的自动化无法表达的灵活性、自然语言和情境——代价是更多配置和硬件。 把规则用于确定性触发;把 LLM 用在意图和情境要紧的地方。
- 具体的自动化示例及其背后的提示词,参见用本地LLM实现更聪明的自动化。
- 把确定性的安全自动化(烟雾报警、门锁)保持为简单规则——不要经过模型。
| 维度 | 基于规则的自动化 | 本地LLM自动化 |
|---|---|---|
| 灵活性 | 固定触发 → 固定动作 | 解读目标并适应情境 |
| 自然语言 | 无——你需接线精确条件 | 自然语言命令与意图 |
| 情境感知 | 仅你脚本化的状态 | 跨时间、在场、传感器推理 |
| 配置 | 每条规则简单 | 更高——中枢 + 模型 + 接线 |
| 硬件需求 | 极小(一个 Pi) | 一台迷你 PC;GPU/NPU 有助于延迟 |
硬件现实
你可以在一台迷你 PC 上同时运行 Home Assistant 和一个小型本地模型;GPU、强力 iGPU 或 NPU 可降低响应延迟。 本指南不再赘述 VRAM 或模型量化——相关深度请见外链。
- 一台机器就够: 一台迷你 PC 可同时托管 Home Assistant 和通过 Ollama 的小型模型。选购见Home Assistant + 本地AI 的最佳迷你 PC。
- 延迟随硬件而变: 更大的模型和纯 CPU 推理响应更慢;GPU 或现代 iGPU/NPU 能把差距缩短到一个利落的助手。VRAM 与模型规模见本地智能家居的最佳硬件。
- 按任务选模型: 家庭控制更看重小而快、支持函数调用的模型,而非最大的——参见智能家居控制的最佳本地LLM模型。
你的分步路径
按顺序搭建:Home Assistant,然后 Ollama,然后对话代理,再加语音和自动化。 每一步都在专门的教程中讲解,使这篇旗舰文章保持为一张地图,而非一堵命令墙。
- 1在迷你 PC 上设置 Home Assistant——入门指南。
- 2安装 Ollama 并拉取一个小型模型——如何安装 Ollama。
- 3把 Ollama 连接到 Home Assistant 并设为对话代理——集成教程。
- 4选择适配家庭控制的模型——智能家居的最佳本地LLM模型。
- 5添加一个完全本地的语音前端——本地语音助手。
- 6设计情境化自动化——用本地LLM实现AI自动化。
常见问题
家庭控制最好用哪个本地模型?
一个能遵循指令、具备可靠函数调用的小型模型——通常在 3B 到 8B 之间——最为合适,因为家庭控制更需要快速且结构化的响应,而非最大的模型。正确选择取决于你的硬件;当前选项见智能家居最佳本地LLM模型指南。
本地LLM智能家居需要 GPU 吗?
不需要,但有帮助。小型模型可在现代 CPU 或强力集成 GPU 上运行;独立 GPU 或 NPU 主要降低响应延迟,让助手更利落。应按硬件匹配模型规模。
本地LLM智能家居能离线工作吗?
能。模型通过 Ollama 在本地运行,Home Assistant 经由你的 LAN 控制设备,因此自然语言控制和自动化无需联网即可工作。只有从屋外远程访问才需要联网。
本地LLM比 Alexa 更快吗?
取决于硬件和模型规模。Alexa 等云端助手为低延迟优化,而本地LLM以一些速度换取隐私和离线运行;在配备 GPU 的迷你 PC 上差距会缩小。决定性优势是隐私与掌控,而非纯粹速度。
本地LLM智能家居能在 Raspberry Pi 上运行吗?
Raspberry Pi 能很好地运行 Home Assistant,但 Pi 上的 LLM 推理仅限于非常小且缓慢的模型。要获得利落的本地LLM助手,配备强力 iGPU/NPU 或独立 GPU 的迷你 PC 是更好的选择。