关键要点
- 家庭控制看重低延迟和可靠的函数调用,而非最大的模型大小
- 4B 模型适合低功耗硬件;8B 模型适合带 GPU 或 NPU 的迷你 PC
- Gemma 3 4B(Google)、Qwen3 4B(Alibaba)和 Qwen3 8B(Alibaba)是常见且受良好支持的选择
- Qwen3、Gemma 3 和 Phi-4-mini 如今具备经过验证的 Home Assistant 工具调用支持
- 选择对你与它交谈所用语言有强力支持的模型
- 关于深入的模型排名与机制,以外链指向 local-llms 集群
家庭控制重要的是什么
有三点决定一个好的家庭控制模型:延迟、可靠的函数调用,以及与你硬件相称的大小。 在这里,基准排行榜远不如响应性重要。
- 延迟: 语音命令应当近乎即时;高性能硬件上的小型模型响应更快。
- 函数调用: 模型必须可靠地输出结构化的设备动作——这是决定性的能力。
- 相称: 模型必须能在同时托管 Home Assistant 的机器上从容运行——参见本地智能家居的最佳硬件。
精选清单
这些小型模型是跨不同硬件预算、用于家庭控制的常见且受良好支持的选择。 在轻量硬件上用 4B 模型,有 GPU 或 NPU 时用 8B 模型。Gemma 4(2026 年 6 月)是最新选项;Qwen3、Gemma 3 和 Phi-4-mini 如今具备经过验证的 Home Assistant 工具调用支持。
- Gemma 3 4B(Google): 一个 40 亿参数的模型,具备广泛的多语言覆盖(140 多种语言),是强力的低功耗选择——Ollama 标签
gemma3:4b。 - Qwen3 4B(Alibaba): 一个快速的 4B 模型,工具使用可靠、多语言支持良好,在 CPU 或集成 GPU 上低延迟——
qwen3:4b。 - Phi-4-mini(Microsoft): 一个紧凑的 3.8B 模型,在指令遵循上的表现超出其体量——
phi4-mini。 - Llama 3.2 3B(Meta): 一个广受支持的 3B 基线,能在普通硬件上以良好的函数调用运行——
llama3.2:3b。 - Qwen3 8B(Alibaba): 此处在 GPU 或 NPU 上质量最佳,是工具调用方面 Home Assistant 的热门之选——
qwen3:8b。
比较
按硬件和语言选择:仅 CPU 或 Pi 级硬件用更小的模型,带 GPU 的迷你 PC 用 8B。 下面的大小为常见 4 位量化下的近似值;Ollama 标签即要拉取的确切模型。
- 占用为近似值,取决于量化——关于 VRAM 和量化细节,以外链指向 local-llms 集群。
| 模型 | 参数量 | 近似占用 (Q4) | Ollama 标签 | 最适合 |
|---|---|---|---|---|
| Gemma 3 4B | 4B | 约 3 GB | gemma3:4b | 低功耗主机、140 多种语言 |
| Qwen3 4B | 4B | 约 2.5–3 GB | qwen3:4b | 低延迟、多语言、工具 |
| Phi-4-mini | 3.8B | 约 2.5–3 GB | phi4-mini | 强指令遵循 |
| Llama 3.2 3B | 3B | 约 2–3 GB | llama3.2:3b | 广受支持的基线 |
| Qwen3 8B | 8B | 约 5 GB | qwen3:8b | GPU/NPU 上质量最佳;HA 热门 |
按硬件预算的选择
在 Pi 或仅 CPU 的迷你 PC 上用 4B 模型;有 GPU 或 NPU 时用 8B 模型。 这能在每一档都保持响应灵敏。
- Raspberry Pi / 低功耗: Gemma 3 4B 或 Qwen3 4B,接受更慢的响应。
- 迷你 PC(仅 CPU): 以 Qwen3 4B 或 Phi-4-mini 作为响应良好的默认。
- 带 GPU/NPU 的迷你 PC: 要在可接受延迟下获得最佳质量就用 Qwen3 8B——参见Home Assistant + 本地 AI 的最佳迷你 PC。
如何选择
从 4B 模型开始,确认延迟和可靠的设备动作,仅在质量不足时才换到 8B。 在最终确定之前,用你真实的命令测试。
- 经由 Ollama 集成 安装,并测试你常用的命令。
- 若响应缓慢,降一档或加一块 GPU/NPU。
- 若动作不可靠,优先选择以函数调用著称的模型。
- 关于深入的模型排名与机制,参见2026 最佳本地 LLM(跨集群)——本指南保持专注于家庭控制。
常见问题
家庭控制可用的最小模型是哪个?
像 Llama 3.2 3B 这样的 3B 模型,是低功耗硬件上可靠设备控制的实际下限,以部分理解力换取速度。若你的硬件允许,像 Gemma 3 4B 或 Qwen3 4B 这样的 4B 模型是更好的平衡。
家庭控制模型需要 GPU 吗?
4B 模型不需要,它们在 CPU 或集成 GPU 上运行。GPU 或 NPU 主要让你以低延迟运行像 Qwen3 8B 这样的 8B 模型以获得更好理解。把模型匹配到你的硬件。
哪些模型支持函数调用?
包括 Qwen3、Gemma 3 和 Phi-4-mini 在内的现代小型模型具备经过验证的 Home Assistant 工具/函数调用支持,这正是让它们输出可靠设备动作的能力。家庭控制请优先选择有文档支持的模型。
Raspberry Pi 的最佳模型是哪个?
像 Gemma 3 4B 或 Qwen3 4B 这样的 4B 模型,是 Raspberry Pi 上的实际上限,响应会比迷你 PC 更慢。要想助手灵敏,运行 Qwen3 8B 的带 GPU/NPU 迷你 PC 是更好的主机。