关键要点
- 本地(Assist + Whisper + Piper + 本地 LLM):私密、无费用、离线、配置更多
- 云端(Alexa、Google):最简单、第三方技能最广、成熟、云端处理
- 本地准确度取决于你的 Whisper 模型大小和麦克风
- 云端在零配置和广泛技能上领先;本地在隐私和成本上领先
- 配 GPU 的迷你 PC 可缩小本地的延迟差距
- 要隐私和掌控就选本地,要便利就选云端
两种路径
本地助手在你的硬件上运行语音、理解和回应;云端助手则在厂商服务器上运行它们。 这一个差异决定了各种取舍。
- 本地: Home Assistant Assist + Whisper(STT)+ Piper(TTS)+ 可选的本地 LLM——参见搭建完全本地的语音助手。
- 云端: Alexa 或 Google 在它们的服务器上处理你的语音。
- 这一选择映照了更广泛的本地对云端决策——参见为何本地胜过云端。
对比
本地在隐私、成本和离线上胜出;云端在技能和投入上胜出。 用下表对应你的优先事项。
| 标准 | 本地 (Assist + Whisper + LLM) | 云端 (Alexa / Google) |
|---|---|---|
| 隐私 | 设备本地,私密 | 语音在云端处理 |
| 成本 | 一次性硬件 | 硬件便宜,可能有费用 |
| 准确度 | 取决于模型/硬件 | 成熟、一致 |
| 技能 | 聚焦家庭控制 | 广泛第三方技能 |
| 离线 | 可离线工作 | 需要互联网 |
| 投入 | 配置更多 | 即插即用 |
支持本地的隐私与成本理由
本地语音把录音留在你的硬件上并避免订阅,这是选择它的最有力理由。 它在断网时也能工作。
- 没有语音录音被发送给厂商——参见智能家居隐私风险。
- 无订阅;硬件一次性付费。
- 为自然语言理解添加本地 LLM——参见用本地LLM运行你的智能家居。
云端仍胜出之处
云端助手在零投入配置、稳定准确度和第三方技能广度上仍然胜出。 如果你想要购物、广泛的应用集成且无需配置,云端领先。
- 开箱即用,无需管理硬件。
- 超出家庭控制范围的广泛第三方技能生态。
- 无需调优模型或麦克风即可获得一致的识别。
推荐
若看重隐私、成本或离线运行就选本地;若想要零配置和最广技能就选云端。 若拿不定主意且看重隐私,就用一台迷你 PC 从本地起步。
- 隐私 / 离线 / 无费用: 本地堆栈。
- 零配置 / 技能最广: Alexa 或 Google。
- 犹豫但偏向隐私: 用配 GPU 的迷你 PC 从本地起步——参见Home Assistant + 本地 AI 的最佳迷你 PC。
常见问题
现在本地语音和云端一样好吗?
对于家庭控制和自然语言命令,配备好的 Whisper 模型和本地 LLM 的本地堆栈非常有能力。云端助手在开箱即用的稳定准确度,以及超出家庭控制的广泛第三方技能上仍然领先。
本地语音助手是完全离线的吗?
是。语音转文字、文字转语音、意图处理和可选的本地 LLM 都在你的硬件上运行,因此本地语音助手在没有互联网时也能工作。只有来自家庭之外的远程访问才需要连通性。
成本差异是什么?
本地语音是一次性硬件成本且无订阅,而云端助手硬件便宜,但可能把费用绑定到高级功能上。随时间推移,本地通常更便宜,并让你的语音数据保持私密。
本地语音需要多少配置投入?
比云端助手多:你要安装 Home Assistant、添加 Whisper 和 Piper、经由 Wyoming 连接,并可选地添加本地 LLM。它更像一个周末项目,而不是点几下,但有完善的文档。