快速回答
三款迷你电脑在本地 LLM 推理中表现突出:Mac Mini M4(最快,~18 tok/s)、Minisforum UM790 Pro(最大内存,64 GB DDR5)和 Beelink SER8(最佳性价比,Ryzen 9 8845HS CPU)。三者均可无独立 GPU 运行 7–13B Q4 模型。
更新于: 2026-05
关键要点
Mac Mini M4 在 7B Q4 模型上达到每秒约 18 个 token,负载下消耗约 30 W,起价约 599 USD——使其成为本地 LLM 推理中最快的迷你电脑。 M4 芯片采用统一内存架构,意味着相同的物理内存在 CPU 和 GPU 之间共享,无需内存复制开销。对于优先考虑速度的用户,M4 是最佳选择。
Minisforum UM790 Pro 是扩展方案:AMD Ryzen 9 7940HS 搭配 Radeon 780M iGPU,支持高达 64 GB DDR5 统一内存配置,Linux 和 ROCm 下 ~8 tok/s。Beelink SER8(Ryzen 9 8845HS)与 UM790 Pro 吞吐量相当但采用仅 CPU 推理——无需独立 GPU——使其成为希望避免 ROCm 配置的 Windows/Linux 用户的经济实惠之选。
下表比较了三款迷你电脑的 CPU/GPU、最佳内存配置和测量的 LLM 速度。
| 迷你电脑 | CPU/GPU | 最佳配置 | LLM 速度(7B Q4) |
|---|---|---|---|
| Mac Mini M4 | Apple M4 | 16 GB 统一内存 | ~18 tok/s |
| Minisforum UM790 Pro | Ryzen 9 7940HS | 64 GB DDR5 | ~8 tok/s |
| Beelink SER8 | Ryzen 9 8845HS | 64 GB DDR5 | ~8 tok/s |
配备独立 GPU 插槽的标准迷你电脑不适合 LLM 推理,因为 GPU VRAM 在出厂时固定——通常为 4–8 GB——无法扩展。Mac Mini M4 和 UM790 Pro 通过统一内存的基于 GPU 推理来解决此问题。Beelink SER8 采用不同方法:其 Ryzen 9 8845HS 使用仅 CPU 推理,速度更慢但无需 GPU 设置。
配备 16 GB 统一内存的 Mac Mini M4 在纯推理速度上超越配备 32 GB DDR5 的 UM790 Pro,因为 Apple 的内存带宽(~68 GB/s)和 Metal GPU 加速比 Radeon 780M iGPU 更高效。UM790 Pro 的优势是可扩展到 64 GB,允许运行 16 GB 放不下的 13B 和 30B Q4 等更大模型。
有关本地 LLM 硬件选择的完整指南,请参阅涵盖本地 LLM 配置软件方面的 最佳 Ollama 前端概览。