コーディング向け最適Qwenモデルは?
クイック回答
Qwen2.5-Coder 32Bが24 GB VRAMで最高性能(HumanEval 91.5%)。8 GB VRAMなら7B(79.7%、8–15 tok/s)。14Bは12 GB VRAMの開発者に最適なスイートスポット。
- ▸Qwen2.5-Coder 7B Q4_K_M:5.5 GB VRAM、HumanEval 79.7%——RTX 3060向け
- ▸Qwen2.5-Coder 14B Q4_K_M:9.5 GB VRAM、HumanEval 88.0%——スイートスポット
- ▸Qwen2.5-Coder 32B Q4_K_M:20.5 GB VRAM、HumanEval 91.5%——最高性能
更新: 2026-05
Model Comparisons中級
重要なポイント
- ✓Qwen2.5-Coder 32B Q4_K_M:HumanEval 91.5%——最高のQwenコーディングモデル、24 GB VRAM必要
- ✓Qwen2.5-Coder 14B Q4_K_M:9.5 GB VRAMでHumanEval 88.0%——RTX 3080/4070のスイートスポット
- ✓Qwen2.5-Coder 7B Q4_K_M:5.5 GB VRAMでHumanEval 79.7%——RTX 3060や16 GB RAMに対応
- ✓インストール:`ollama pull qwen2.5-coder:7b` / `14b` / `32b`
Qwen2.5-Coderサイズ比較
Q4_K_MでVRAMに完全に収まる最大モデルを選択してください。
結論:どのサイズを選ぶか
**8 GB VRAM以下(RTX 3060、M2 16 GB):** Qwen2.5-Coder 7B Q4_K_M。KVキャッシュ用のスペースを残してVRAMに収まります。
**12–16 GB VRAM(RTX 3080、RTX 4070、M2 Pro):** Qwen2.5-Coder 14B Q4_K_M。7Bから14Bへの品質向上が最もコスパ高い。
**24 GB VRAM(RTX 4090、M3 Max 48 GB):** Qwen2.5-Coder 32B Q4_K_M——コード生成ベンチマークでGPT-3.5-Turboを上回ります。
よくある質問
詳しく読みたいですか?
コンプリートガイドを読む →関連する Prompt Bites