Skip to main content
PromptQuorumPromptQuorum
主页/Smart Home/智能家居控制的最佳本地 LLM 模型(2026)
Local AI & LLMs in the Smart Home

智能家居控制的最佳本地 LLM 模型(2026)

·阅读约8分钟·Hans Kuepper 作者 · PromptQuorum创始人,多模型AI调度工具 · PromptQuorum

对于智能家居控制,选择一个具备可靠函数调用的小型指令模型——4B 模型是低功耗的最佳点,8B 是值得在 GPU 或 NPU 上运行的上限,因为家庭控制更看重低延迟和结构化输出,而非纯粹的能力。 把模型匹配到你的硬件,而不是挑可得的最大模型。

智能家居控制的最佳本地 LLM 模型,是具备可靠函数调用、小而快、能遵循指令的模型——而不是你硬件能容纳的最大模型。本指南讲解家庭控制真正重要的是什么,给出一份适用小型模型的精选清单,对它们进行比较,并把选择对应到硬件预算,并以外链指向更深入的模型指南,而非把整个领域重新排名。

关键要点

  • 家庭控制看重低延迟和可靠的函数调用,而非最大的模型大小
  • 4B 模型适合低功耗硬件;8B 模型适合带 GPU 或 NPU 的迷你 PC
  • Gemma 3 4B(Google)、Qwen3 4B(Alibaba)和 Qwen3 8B(Alibaba)是常见且受良好支持的选择
  • Qwen3、Gemma 3 和 Phi-4-mini 如今具备经过验证的 Home Assistant 工具调用支持
  • 选择对你与它交谈所用语言有强力支持的模型
  • 关于深入的模型排名与机制,以外链指向 local-llms 集群

家庭控制重要的是什么

有三点决定一个好的家庭控制模型:延迟、可靠的函数调用,以及与你硬件相称的大小。 在这里,基准排行榜远不如响应性重要。

  • 延迟: 语音命令应当近乎即时;高性能硬件上的小型模型响应更快。
  • 函数调用: 模型必须可靠地输出结构化的设备动作——这是决定性的能力。
  • 相称: 模型必须能在同时托管 Home Assistant 的机器上从容运行——参见本地智能家居的最佳硬件

精选清单

这些小型模型是跨不同硬件预算、用于家庭控制的常见且受良好支持的选择。 在轻量硬件上用 4B 模型,有 GPU 或 NPU 时用 8B 模型。Gemma 4(2026 年 6 月)是最新选项;Qwen3、Gemma 3 和 Phi-4-mini 如今具备经过验证的 Home Assistant 工具调用支持。

  • Gemma 3 4B(Google): 一个 40 亿参数的模型,具备广泛的多语言覆盖(140 多种语言),是强力的低功耗选择——Ollama 标签 gemma3:4b
  • Qwen3 4B(Alibaba): 一个快速的 4B 模型,工具使用可靠、多语言支持良好,在 CPU 或集成 GPU 上低延迟——qwen3:4b
  • Phi-4-mini(Microsoft): 一个紧凑的 3.8B 模型,在指令遵循上的表现超出其体量——phi4-mini
  • Llama 3.2 3B(Meta): 一个广受支持的 3B 基线,能在普通硬件上以良好的函数调用运行——llama3.2:3b
  • Qwen3 8B(Alibaba): 此处在 GPU 或 NPU 上质量最佳,是工具调用方面 Home Assistant 的热门之选——qwen3:8b

比较

按硬件和语言选择:仅 CPU 或 Pi 级硬件用更小的模型,带 GPU 的迷你 PC 用 8B。 下面的大小为常见 4 位量化下的近似值;Ollama 标签即要拉取的确切模型。

  • 占用为近似值,取决于量化——关于 VRAM 和量化细节,以外链指向 local-llms 集群。
模型参数量近似占用 (Q4)Ollama 标签最适合
Gemma 3 4B4B约 3 GBgemma3:4b低功耗主机、140 多种语言
Qwen3 4B4B约 2.5–3 GBqwen3:4b低延迟、多语言、工具
Phi-4-mini3.8B约 2.5–3 GBphi4-mini强指令遵循
Llama 3.2 3B3B约 2–3 GBllama3.2:3b广受支持的基线
Qwen3 8B8B约 5 GBqwen3:8bGPU/NPU 上质量最佳;HA 热门

按硬件预算的选择

在 Pi 或仅 CPU 的迷你 PC 上用 4B 模型;有 GPU 或 NPU 时用 8B 模型。 这能在每一档都保持响应灵敏。

  • Raspberry Pi / 低功耗: Gemma 3 4B 或 Qwen3 4B,接受更慢的响应。
  • 迷你 PC(仅 CPU): 以 Qwen3 4B 或 Phi-4-mini 作为响应良好的默认。
  • 带 GPU/NPU 的迷你 PC: 要在可接受延迟下获得最佳质量就用 Qwen3 8B——参见Home Assistant + 本地 AI 的最佳迷你 PC

如何选择

从 4B 模型开始,确认延迟和可靠的设备动作,仅在质量不足时才换到 8B。 在最终确定之前,用你真实的命令测试。

  • 经由 Ollama 集成 安装,并测试你常用的命令。
  • 若响应缓慢,降一档或加一块 GPU/NPU。
  • 若动作不可靠,优先选择以函数调用著称的模型。
  • 关于深入的模型排名与机制,参见2026 最佳本地 LLM(跨集群)——本指南保持专注于家庭控制。

常见问题

家庭控制可用的最小模型是哪个?

像 Llama 3.2 3B 这样的 3B 模型,是低功耗硬件上可靠设备控制的实际下限,以部分理解力换取速度。若你的硬件允许,像 Gemma 3 4B 或 Qwen3 4B 这样的 4B 模型是更好的平衡。

家庭控制模型需要 GPU 吗?

4B 模型不需要,它们在 CPU 或集成 GPU 上运行。GPU 或 NPU 主要让你以低延迟运行像 Qwen3 8B 这样的 8B 模型以获得更好理解。把模型匹配到你的硬件。

哪些模型支持函数调用?

包括 Qwen3、Gemma 3 和 Phi-4-mini 在内的现代小型模型具备经过验证的 Home Assistant 工具/函数调用支持,这正是让它们输出可靠设备动作的能力。家庭控制请优先选择有文档支持的模型。

Raspberry Pi 的最佳模型是哪个?

像 Gemma 3 4B 或 Qwen3 4B 这样的 4B 模型,是 Raspberry Pi 上的实际上限,响应会比迷你 PC 更慢。要想助手灵敏,运行 Qwen3 8B 的带 GPU/NPU 迷你 PC 是更好的主机。

← 返回 Smart Home

Home Assistant 的最佳本地 LLM(2026) | PromptQuorum