关键要点
- 入门级:Mac Studio M5 Pro 32GB(¥10,000)。处理7B-13B模型良好。适合测试。
- 最佳价值点:Mac Studio M5 Max 64GB(¥13,000)。以8-12标记/秒运行Llama 3.1 70B Q4。最佳性价比。
- 最大性能:Mac Studio M5 Max 128GB(¥18,000)。70B Q5支持庞大上下文窗口。用于认真工作。
- 便携式:MacBook Pro 16" M5 Max 64GB(¥18,000)。与Mac Studio相同性能,长时间推理有热节流风险。
- 所有M5配置:460-614 GB/s内存带宽(RTX 4090为1008 GB/s但仅限24GB VRAM)。
- 静音运行:Mac Studio风扇很少启动。65-100W功耗对比RTX设置350W+。
- 在M5上MLX最快。Ollama自动使用MLX后端(2026年5月版本)。
- 统一内存架构:任何模型均可用128GB。与离散GPU的VRAM限制不同。