PromptQuorumPromptQuorum

Radeon RX 6800M でローカル LLM を実行できますか?

クイック回答

はい。Radeon RX 6800M は 12 GB GDDR6 VRAM を持ち、ローカル LLM を実行できます。Linux では ROCm で GPU 加速、Windows では Vulkan バックエンドの llama.cpp か CPU フォールバックを使用します。Linux + ROCm での Llama 3 8B Q4_K_M は ~12 tok/s で動作します。

  • Linux + ROCm:完全な GPU 加速、Llama 3 8B Q4 で ~12 tok/s
  • Windows:Vulkan バックエンドの llama.cpp でパーシャル GPU オフロード
  • 12 GB VRAM は Q4_K_M で 14B までのモデルをサポート

更新: 2026-05

Hardware-Specific

重要なポイント

  • Radeon RX 6800M は 12 GB GDDR6 VRAM を持つ — 同世代のモバイル AMD GPU 最大の VRAM
  • Linux + ROCm で完全な GPU 加速:Llama 3 8B Q4_K_M は ~12 tok/s で動作
  • 6800M への Windows ROCm サポートは限定的 — Vulkan バックエンドの llama.cpp を使用
  • 12 GB VRAM は Q4_K_M で 14B までのモデルに対応し、本格的なコーディング用途に対応可能

Radeon RX 6800M の VRAM 容量とプラットフォームサポート

Radeon RX 6800M は 12 GB GDDR6 VRAM を持つモバイル GPU で、Q4_K_M 量子化でレイヤーオフロードなしに最大 14B パラメータのモデルを実行できます。 これは同世代のモバイル AMD GPU の中で最大の VRAM です。

ソフトウェアサポートが主な制約です。Linux では ROCm が完全な OpenCL/HIP GPU 加速を提供し、Ollama が 6800M を自動検出します。ollama pull llama3:8b を実行後 ollama run llama3:8b で起動します。Llama 3 8B Q4_K_M の実測スループットは約 12 tok/s です。

Windows では AMD ROCm が 2026 年中頃時点でコンシューマードライバースタック内で 6800M をサポートしていません。実用的な解決策は Vulkan でビルドした llama.cpp で、GPU に演算レイヤーをオフロードし部分的な加速を実現します。Vulkan 経由の Llama 3 8B Q4_K_M では 6〜8 tok/s を見込んでください。

プラットフォームバックエンドLlama 3 8B Q4 速度
LinuxROCm (Ollama)~12 tok/s
WindowsVulkan (llama.cpp)~6–8 tok/s
Windows/LinuxCPU のみ~3–5 tok/s

12 GB VRAM に向けたモデル選択

12 GB の VRAM は 8 GB カードと比べて大きなアドバンテージです。Q4_K_M の 13B モデル(~8.5 GB VRAM)や Q4 の 14B モデルも上限なしに実行できます。 これにより、ちょうど 12 GB に収まる Mistral Nemo 12B などのモデルも使用可能になります。

コーディングタスクでは、DeepSeek Coder 6.7B(Q4_K_M)がわずか ~5 GB VRAM を使用し、Linux の 6800M で 20 tok/s 近くで動作します。これにより大きなコンテキストウィンドウのための十分な容量が残ります。12 GB では KV キャッシュを退避させることなく長いコンテキストも扱えます。

NVIDIA と AMD の 12 GB VRAM カードの比較や対応モデルについては、ローカル LLM 向け GPU ガイドをご覧ください。

Radeon 6800M とローカル LLM に関するよくある質問

Linux での Radeon RX 6800M で Ollama は動作しますか?
はい。Ollama は Linux 上で ROCm をサポートし AMD GPU を自動検出します。6800M は RDNA 2 デバイスとして認識されます。ollama pull llama3:8b を実行後 ollama run llama3:8b で起動します。モデル実行中に rocm-smi で GPU 使用を確認できます。
Windows で Radeon RX 6800M をローカル LLM に使えますか?
2026 年中頃時点で ROCm は Windows 上の 6800M をサポートしていません。代わりに Vulkan サポートでコンパイルした llama.cpp を使用してください。llama.cpp リリースページからビルド済み Vulkan バイナリをダウンロードし、-ngl 33 で GGUF モデルをロードしてレイヤーを GPU にオフロードします。
12 GB VRAM に収まる最大のモデルは?
Q4_K_M では 13B モデルが約 8.5 GB、14B モデルが約 9 GB を使用します — どちらも 12 GB に収まります。より高品質な出力のために Q8 の 7B モデル(~8 GB)も実行できます。20B 以上のモデルには Q3 以下が必要です。
Radeon RX 6800M はローカル LLM 推論で NVIDIA と比べて優秀ですか?
同等の VRAM では、NVIDIA GPU が CUDA/llama.cpp の統合の良さから Windows では一般的に AMD より高速です。Linux では ROCm によりその差が縮まります。6800M の 12 GB VRAM のアドバンテージが 8 GB NVIDIA カードに対してソフトウェアオーバーヘッドを上回ることも多くあります。