クイック回答
ローカルLLM推論で3つのミニPCが目立ちます:Mac Mini M4(最速、~18 tok/s)、Minisforum UM790 Pro(最大RAM、64 GB DDR5)、Beelink SER8(最高コスパ、Ryzen 9 8845HS CPU)。3つすべて専用GPUなしで7–13B Q4モデルを実行可能です。
更新: 2026-05
重要なポイント
Mac Mini M4は7B Q4モデルで毎秒~18トークンを達成し、負荷時に~30 Wを消費し、約599 USDから購入可能です — ローカルLLM推論において最速のミニPCです。 M4チップはユニファイドメモリアーキテクチャを使用しており、メモリコピーのオーバーヘッドなしに同じ物理RAMをCPUとGPUが共有します。速度を優先するユーザーにはM4が最適です。
Minisforum UM790 Proはスケーリングオプション:AMD Ryzen 9 7940HSとRadeon 780M iGPU、最大64 GB DDR5をユニファイドメモリとして設定、Linux上のROCmで~8 tok/s。Beelink SER8(Ryzen 9 8845HS)はUM790 Proと同等のスループットですがCPUベース推論 — 専用GPUは不要 — これによってWindows/Linuxユーザー向けの予算に優しい選択肢となり、ROCmセットアップ回避が可能です。
以下の表は、CPU/GPU、最適なメモリ構成、測定されたLLM速度の3つの観点から3つのミニPCを比較しています。
| ミニPC | CPU/GPU | 最適構成 | LLM速度(7B Q4) |
|---|---|---|---|
| Mac Mini M4 | Apple M4 | 16 GBユニファイド | ~18 tok/s |
| Minisforum UM790 Pro | Ryzen 9 7940HS | 64 GB DDR5 | ~8 tok/s |
| Beelink SER8 | Ryzen 9 8845HS | 64 GB DDR5 | ~8 tok/s |
専用GPUスロットを持つ標準的なミニPCはLLM推論に適していません。なぜならGPUのVRAMは工場出荷時に固定(通常4–8 GB)され、拡張できないからです。Mac Mini M4とUM790 Proはユニファイドメモリ対応GPU推論でこの問題を解決しています。Beelink SER8は異なるアプローチ:Ryzen 9 8845HSはCPUベース推論を使用し、これは遅いですがGPUセットアップが不要です。
16 GBユニファイドメモリのMac Mini M4は純粋な推論速度で32 GB DDR5のUM790 Proを上回ります。これはAppleのメモリ帯域幅(~68 GB/s)とMetalのGPUアクセラレーションがRadeon 780M iGPUより効率的なためです。UM790 Proの利点は64 GBへの拡張性で、16 GBに収まらない13Bや30B Q4などの大型モデルの実行を可能にします。
ローカルLLMのハードウェア選択に関する完全なガイドについては、ローカルLLMセットアップのソフトウェア面をカバーする最適なOllamaフロントエンド概要をご覧ください。