PromptQuorumPromptQuorum

RTX 3060 12 GB向け最良Ollamaモデルは?

Quantization & VRAM

重要なポイント

  • 汎用ベスト:Q5_K_MのLlama 3 8B — 7 GB VRAM、~25トークン/秒、優秀なチャットとコーディング品質
  • コーディングベスト:Q4_K_MのQwen 2.5 Coder 14B — 10 GB VRAM、14Bクラス最高HumanEvalスコア
  • RTX 3060 12 GBはQ4の14Bモデルを動かせる$400未満の唯一のコンシューマーGPU

RTX 3060 12 GB向けトップ5 Ollamaモデル

2026年5月現在、RTX 3060 12 GBは14Bモデルをローカルで動かす最安のルートです。その12 GB VRAMはRTX 4070 Ti(約$800)やRTX 4080(約$1,100)と同等の能力を、はるかに低コストで実現します。¥40,000–¥53,000の中古カードで、3倍以上の価格のカードと同じモデル容量を得られます。

以下の5つのモデルはすべてOllamaで即座に動作します。速度数値はCPUオフロードなしのデスクトップPCでデフォルト2048トークンコンテキスト時の値です。

モデル使用VRAM速度
Llama 3 8B Q5_K_M7.0 GB~25トークン/秒
Qwen 2.5 Coder 14B Q4_K_M10.0 GB~20トークン/秒
Mistral 7B Q6_K6.5 GB~27トークン/秒
Phi-4 Q5_K_M6.2 GB~28トークン/秒
Qwen 14B Q4_K_M10.0 GB~18トークン/秒

RTX 3060で最高のパフォーマンスを得る方法

汎用用途には、4096トークンコンテキストウィンドウでQ5_K_MのLlama 3 8Bを実行してください。合計約8 GB VRAMを使用し、4 GBの余裕を残します。

コーディングには、Q4_K_MのQwen 2.5 Coder 14Bが明確な選択です:HumanEvalでLlama 3 8Bを上回り、10 GB VRAMに収まり、ファインチューニングなしでPython、TypeScript、Goを処理します。

常に少なくとも1.5–2 GB VRAMを空けておいてください。完全なGPUベンチマーク背景についてはローカルLLM向け最良GPUを参照してください。GPUが12 GB未満の場合は6 GB VRAM向け最良モデルをご覧ください。RTX 3060で汎用Pickを実行するには:

ollama pull llama3:8b-instruct-q5_K_M
ollama run llama3:8b-instruct-q5_K_M
Pullは初回実行時に約7 GBをダウンロードします。以降の実行はキャッシュから即座に開始します。より大きなコンテキストウィンドウが必要な場合は--num-ctx 4096を使用してください。

RTX 3060モデルに関するよくある質問

RTX 3060は70Bモデルを動かせますか?
いいえ。Q4_K_Mの70Bモデルには約40 GB VRAMが必要です。RTX 3060 12 GBはQ4で最大~14Bモデルまでです。選択肢については70Bモデルに必要なVRAMを参照してください。
RTX 3060 12 GBはローカルLLMに良いですか?
はい — このVRAMティアで最高のコストパフォーマンスです。12 GBの容量により、8 GBカードでは実行できないQ4の14Bモデルが可能になります。街価は通常¥40,000–¥53,000(中古)です。
RTX 3060 12 GBではどの量化を使うべきですか?
7–8BモデルにはQ5_K_M(12 GBバジェット内での最高品質)。13–14BモデルにはQ4_K_M(収めるために必要)。品質のトレードオフについてはQ4_K_Mの意味を参照してください。
OllamaはRTX 3060 GPUを自動的に使用しますか?
はい。OllamaはWindowsとLinuxでCUDA経由でNVIDIA GPUを自動的に検出します。手動設定は不要です。ollama run モデル名を実行すると、VRAMが十分であれば完全にGPUにロードされます。