本地LLM问题的快速解答
67篇简答指南。显存要求、Ollama推荐、硬件对比和设置技巧 — 60秒内解答。
| VRAM | 最佳模型(2026年5月) | 量化 | 使用场景 |
|---|---|---|---|
| 4 GB | Phi-4 Mini | Q4 | 基础聊天、小型任务 |
| 6 GB | Llama 3 8B | Q4_K_M | 日常聊天和编程 |
| 8 GB | Mistral 7B | Q5_K_M | 质量与速度均衡 |
| 12 GB | Qwen 14B | Q4_K_M | 编程和推理 |
| 16 GB | Qwen 32B | Q4_K_M | 复杂多步任务 |
| 24 GB | Llama 70B | Q4_K_M (部分) | 接近生产质量 |
| 48+ GB | Llama 70B | Q5_K_M或更高 | 完整精度模型 |
A量化与显存
所需内存量、选择哪种量化格式以及VRAM决策树。
已更新
Q4_K_M量化是什么?
已更新
7B模型需要多少内存?
BOllama
最新版本、最佳模型、上下文窗口、视觉和纯CPU使用。
C工具比较
双向对比:Ollama vs LM Studio、Jan vs LM Studio、Qwen vs DeepSeek。
D模型比较
最佳14B模型、MoE模型、迷你PC及正面对决模型比较。
E特定硬件
硬件选择和购买指南:按预算推荐GPU、迷你PC、SSD、云GPU和eGPU。
F快速解答
是/否和单数字答案:RAM限制、笔记本推荐。
G提示词工程
提示词工程概念的快速定义和最佳列表。
H隐私与合规
GDPR合规性、数据主权以及隐私安全的本地AI部署。