Skip to main content
PromptQuorumPromptQuorum

コーディング向け最適Qwenモデルは?

クイック回答

Qwen2.5-Coder 32Bが24 GB VRAMで最高性能(HumanEval 91.5%)。8 GB VRAMなら7B(79.7%、8–15 tok/s)。14Bは12 GB VRAMの開発者に最適なスイートスポット。

  • Qwen2.5-Coder 7B Q4_K_M:5.5 GB VRAM、HumanEval 79.7%——RTX 3060向け
  • Qwen2.5-Coder 14B Q4_K_M:9.5 GB VRAM、HumanEval 88.0%——スイートスポット
  • Qwen2.5-Coder 32B Q4_K_M:20.5 GB VRAM、HumanEval 91.5%——最高性能

更新: 2026-05

Model Comparisons中級

重要なポイント

  • Qwen2.5-Coder 32B Q4_K_M:HumanEval 91.5%——最高のQwenコーディングモデル、24 GB VRAM必要
  • Qwen2.5-Coder 14B Q4_K_M:9.5 GB VRAMでHumanEval 88.0%——RTX 3080/4070のスイートスポット
  • Qwen2.5-Coder 7B Q4_K_M:5.5 GB VRAMでHumanEval 79.7%——RTX 3060や16 GB RAMに対応
  • インストール:`ollama pull qwen2.5-coder:7b` / `14b` / `32b`

Qwen2.5-Coderサイズ比較

Q4_K_MでVRAMに完全に収まる最大モデルを選択してください。

結論:どのサイズを選ぶか

**8 GB VRAM以下(RTX 3060、M2 16 GB):** Qwen2.5-Coder 7B Q4_K_M。KVキャッシュ用のスペースを残してVRAMに収まります。

**12–16 GB VRAM(RTX 3080、RTX 4070、M2 Pro):** Qwen2.5-Coder 14B Q4_K_M。7Bから14Bへの品質向上が最もコスパ高い。

**24 GB VRAM(RTX 4090、M3 Max 48 GB):** Qwen2.5-Coder 32B Q4_K_M——コード生成ベンチマークでGPT-3.5-Turboを上回ります。

よくある質問