重要なポイント
- 同じVRAM:どちらの7Bモデルも5.5 GB(Q4_K_M);32Bは20.5 GB
- 数学:DeepSeek-R1-Distill-Qwen-32Bが勝利(MATH-500 94% vs 90.3%)
- コーディング:Qwen2.5-Coder 32Bが勝利(HumanEval 91.5% vs 83.2%)
- 中国語:Qwen2.5が勝利——ネイティブCJKトークナイゼーション、30–40%効率向上
- 推論チェーン:DeepSeek-R1蒸留はデフォルトで長い思考連鎖を生成
直接ベンチマーク比較
すべてのスコアはQ4_K_M量子化での値。
ハードウェア層別おすすめモデル
VRAM要件は両ファミリーで同一です。DeepSeekとQwenの選択はタスクの好みであり、ハードウェアの制約ではありません。
- 8 GB VRAM(RTX 3060 / M2 16 GB): コーディング・チャットはQwen2.5 7B;数学tutoring はDS-R1-Distill-Qwen-7B
- 24 GB VRAM(RTX 4090 / M3 Max 48 GB): Qwen2.5-Coder 32B——このティアで最高の汎用モデル
- CPUのみ(32+ GB RAM): Qwen2.5 7BまたはDS-R1-Distill 7B——3〜8 tok/sで動作
DeepSeekローカルモデル解説
DeepSeek-R1は671B MoEモデルでサーバー用ハードウェアが必要です。ローカル利用には蒸留版が実用的な選択肢です。
- DS-R1-Distill-Qwen-7B: 5.5 GB VRAM。MATH-500 88%——7Bティアで最強の数学モデル。
- DS-R1-Distill-Qwen-32B: 20.5 GB VRAM。MATH-500 94%——コンシューマー向けモデル中最高の数学スコア。
- Ollamaコマンド:
ollama run deepseek-r1:7b
Qwen2.5ローカルモデル解説
Qwen2.5はアリババの2025年10月リリースで、ベース・Coder・Vision-Languageバリアントをカバーします。
- Qwen2.5 7B: 5.5 GB VRAM。コーディングと中国語テキストに最適な汎用7Bモデル。
- Qwen2.5-Coder 32B: 20.5 GB VRAM。HumanEval 91.5%——コンシューマー向けで最高のコーディングモデル。
- Ollamaコマンド:
ollama run qwen2.5:14b-instruct-q4_K_M
Apple Silicon vs NVIDIA
両ファミリーともOllamaとMetal加速でApple Siliconで良好に動作します。
ユースケース別判定
各ユースケースに対する一文の回答:
- 数学/家庭教師: DS-R1-Distill-Qwen-7B——MATH-500 88% vs Qwen2.5 7Bの62.5%
- コード生成・レビュー: Qwen2.5-Coder 32B——HumanEval 91.5%
- 中国語チャット: Qwen2.5 7B——ネイティブCJKトークナイゼーション
- ステップバイステップ分析: DS-R1-Distill-Qwen-14B——デフォルトで明示的な思考連鎖を生成
よくある質問
DeepSeek-R1と蒸留モデルは同じですか?
いいえ。DeepSeek-R1は671B MoEモデルです。蒸留版(7B、14B、32B)はローカル利用のために訓練された別の高密度モデルです。
DeepSeekとQwenは同じVRAMを使いますか?
はい、同じ量子化レベルで。両方の7Bモデルは約5.5 GB(Q4_K_M)が必要;両方の32Bは20.5 GBが必要です。
中国語テキストにはどちらが良いですか?
Qwen2.5が大幅に優れています。CJKテキストで30〜40%効率が高いネイティブ中国語トークナイザーを使用しています。
8 GB VRAMで数学に最適なモデルは?
DeepSeek-R1-Distill-Qwen-7B。同じVRAMでMATH-500 88%(Qwen2.5 7Bは62.5%)を達成します。
METI AIガイドラインへの対応は?
ローカル実行では、データはお使いのハードウェア上のみで処理されます。METIのAI利活用ガイドラインにおけるデータ管理要件を満たしやすくなります。モデル名・バージョンの記録はどちらのモデルも同様に必要です。