重要なポイント
- 勝者: MacBook Pro M5 Pro($2,199) ― 24 GB統合メモリ、静音、Qwen3 14B Q4で45~60 tok/s。
- Windows最適解: RTX 5080ノート(~$2,799) ― 16 GB GDDR7 VRAM、7Bモデルで持続~70 tok/s。
- Windows予算重視: RTX 5070 Tiノート(~$2,499) ― 12 GB VRAMで7B~13Bモデルを~50 tok/s。
- MacBook Pro M5 Max($3,199~): 36~128 GB統合メモリ ― 他のノートでは扱えない30B~70Bモデルを実行。
- Windows RTX 5000シリーズ: 7Bで生のtok/sはApple Siliconより高速。Macは静音とバッテリーで勝る。
- RTX 4070ノート(2023): 7B~13Bを12~15 tok/sでまだ動作するが、RTX 5080より30~50%低速。
- サーマルスロットリング: Windowsゲーミングノートはデスクトップ同等品比で15~25%の性能低下を想定。
- バッテリー: MacBook M5 Proはバッテリー駆動でLLM推論3~4時間。WindowsノートはGPU負荷下で1~2時間。
📍 一文で説明
2026年6月のローカルLLM向けベストノートPC:MacBook Pro M5 Pro(2,199ドル、24 GBユニファイドメモリ、Qwen3 14B Q4で45〜60トークン/秒)。ベストWindows:RTX 5080ノートPC(約2,799ドル、16 GB VRAM、約70トークン/秒)。低価格Windows:RTX 5070 Tiノートpc(約2,499ドル、12 GB VRAM、約50トークン/秒)。
💬 簡潔に説明
ノートPCのAIについて:Macはユニファイドメモリ(CPU+GPU共有)を使うため、24 GBはWindowsノートPCの16 GB VRAMより大きなモデルを読み込めます。NVIDIA RTX GPUを搭載したWindowsノートPCはモデルがVRAMに収まる場合(16 GBで14Bモデル)より速いですが、AI処理中はうるさく熱くなります。
ノートパソコンに必要なGPUは?
ノートパソコン用GPUはモバイル版で、デスクトップ同等品よりTDPもVRAMも少なくなります。2026年6月の推奨: WindowsはRTX 5070 Ti(12 GB)以上、AppleはMacBook Pro M5 Pro。
- MacBook Pro M5 Pro(24 GB統合): 総合最良。統合メモリでGPUとCPUが同一プールを共有。Qwen3 14Bで45~60 tok/s。静音。$2,199。
- RTX 5080ノート(16 GB GDDR7): LLM向けWindows最良GPU。Llama 3.3 8B Q4で~70 tok/s。ノートで~$2,799。
- RTX 5070 Tiノート(12 GB GDDR7): Windows予算重視の良候補。7Bで~50 tok/s、30B Q4で10~12 tok/s。~$2,499。
- RTX 5070ノート(8 GB GDDR7): 7B専用の最小ライン。8 GB VRAMでQ4の7Bに限定。~$1,899。
- RTX 4070ノート(12 GB GDDR6、2023): まだ動作 ― 7Bで12~15 tok/s、13Bで8~10 tok/s。RTX 5070 Tiより30~50%低速。
- RTX 4060ノート(8 GB GDDR6、2023): 7B専用で10~12 tok/s。2026年の新規購入では回避。
ローカルLLM向けベストノートパソコン(2026年6月)
価格は2026年6月時点で確認済み。すべてOllama、LM Studio、llama.cppを標準で実行できます。アフィリエイト開示: 本ページにコミッションリンクはありません。
- MacBook Pro M5 Pro 14"($2,199、24 GB統合): ローカルLLM向け総合最良ノート。Qwen3 14B Q4で45~60 tok/s。完全に静音。通常使用で10~12時間のバッテリー(LLM負荷下で3~4時間)。関連: ローカルLLMのApple Silicon vs GPU vs CPU。
- MacBook Pro M5 Pro 16"($2,499、24 GB統合): 14"と同じチップで画面とバッテリーが大型。36 GB($2,999)を追加すれば30Bモデルに余裕。関連: Apple Silicon M5 Maxで70Bモデルを実行。
- RTX 5080ノート(~$2,799、16 GB GDDR7): LLM向けWindows最良ノート。Llama 3.3 8B Q4で~70 tok/s。16 GB VRAMで14BモデルをQ8でも余裕。ASUS ROG Strix、MSI Titan、Lenovo Legionのラインナップで入手可。
- RTX 5070 Tiノート(~$2,499、12 GB GDDR7): Windows予算重視の最良候補。7Bで~50 tok/s。12 GB VRAMで7B~13BをQ8、30BをQ4。ASUS ROG、Razer Blade、Dell Alienwareのラインナップで入手可。
- MacBook Pro M5 Max 14"($3,199~、36 GB統合): 外出先で30B~70Bモデルを動かす研究者向け。Llama 3.1 70B Q4で40~60 tok/s。参照: Apple Silicon M5 Maxで70Bモデルを実行。
パフォーマンス期待値: デスクトップ vs ノートパソコン
ノートパソコン用GPUは持続的なLLM推論でスロットリングします。Apple Siliconノートは例外で、M5チップはスロットリングしません。
- MacBook Pro M5 Pro vs デスクトップRTX 4060 Ti: M5 Pro: Qwen3 14B Q4で~55 tok/s。デスクトップRTX 4060 Ti: Llama 3.3 8B Q4で~55 tok/s。スループットは同等だが、M5 Proは同じ速度で8Bでなく14Bを扱える ― 統合メモリの利点。
- RTX 5080ノート vs デスクトップRTX 4060 Ti: RTX 5080ノート: 7B Q4で~70 tok/s(AC接続)。デスクトップRTX 4060 Ti: 8B Q4で~55 tok/s。RTX 5080ノートは7Bの生速度でWindows優位だが、騒音と発熱が大きい。
- サーマルスロットリング(Windowsノート): ゲーミングノートは15分以上の持続推論でデスクトップ同等品比15~25%低下。M5 Proは0% ― Apple Siliconに熱スロットリングなし。
- バッテリー推論: MacBook M5 Proのバッテリー駆動: ~40 tok/s(緩やかな25%低下)。Windows RTX 5080ノートのバッテリー駆動: GPUがiGPUにスロットリングし、推論は2~4 tok/sに低下。本格的なLLM作業ではWindowsノートは必ずAC接続を。
バッテリー寿命と熱管理
ローカルLLM推論はノートのバッテリーを速く消費しますが、Apple Siliconでははるかに緩やかです。
- MacBook Pro M5 Proのバッテリー駆動: LLM推論負荷下で3~4時間。通常の混在使用で10~12時間。ファン音なし。推論速度: ~40 tok/s(緩やかな低下、スロットリングの崖なし)。
- Windows RTX 5080ノートのバッテリー駆動: GPUが無効化されiGPUに切替。LLM推論は2~4 tok/sに低下(実用不可)。軽作業で6~8時間。本格的な推論作業では必ずAC接続を。
- Windowsでの持続推論: ノートをAC接続のままに。GPU負荷下の繰返しの深放電サイクルでバッテリーは速く劣化。
- 冷却パッド(Windowsノート): $30~50の外部パッドで温度5~10℃低下、ブーストクロックを10%長く維持。MacBook Proには不要。
ストレージとRAMアップグレード
MacBook Proのメモリは半田付けで、統合メモリ構成は購入時に選びます。WindowsゲーミングノートはSSD交換、機種によりRAM交換が可能です。
- MacBook Pro: 購入時にメモリを選択。 24 GB M5 Pro($2,199)は14Bに余裕。36 GB M5 Pro($2,999)は30B Q4に余裕を追加。64 GB M5 Max($3,999)は70B Q4を実行。
- Windows SSDアップグレード: ほとんどのゲーミングノートにアクセス可能なM.2スロットあり。512 GB→1 TB NVMeへ更新($80~120)。NVMeは旧型SATA SSDよりモデル読み込みが明らかに高速。
- Windows RAM: 多くのRTX 5080/5070 Tiノートは32 GB DDR5を搭載。複数モデルの実行や重いCPU前処理を行うなら64 GBが有用。
- GPUは交換不可(Windows): マザーボードに半田付け。GPUがローカルLLMの律速要因なので、購入時に慎重な選定を。
ノートパソコンLLMの一般的ミス
- 薄型Windowsウルトラブック(iGPUのみのDell XPS 15、dGPUなしのLenovo ThinkPad)を7B LLM性能ありと期待して購入。統合グラフィックスはせいぜい1~2 tok/s。
- Windowsゲーミングノートにデスクトップ性能を期待。15分以上の持続推論でサーマルスロットリングは現実 ― デスクトップRTX同等品比15~25%低いスループットを想定。
- 推論中のWindowsゲーミングノートを閉じた鞄に入れる。熱籠もりで5分以内にGPUクロックが30%にスロットリング。
- Windows RTXノートをバッテリー駆動でLLM作業に使う。バッテリーではGPUがiGPUに切替わり推論は2~4 tok/sに低下。本格作業は必ずAC電源を。
よくあるご質問
MacBook Pro M5 ProはローカルLLMに適している?
はい ― 2026年6月時点でローカルLLMに最適なノートです。24 GB統合メモリ構成($2,199)はQwen3 14BをQ4で45~60 tok/s、ファン音なしで実行。30Bモデルに余裕を持たせるなら36 GB($2,999)へ。
2026年にローカルでLLMを実行するのに最適なWindowsノートは?
RTX 5080ノート(~$2,799、16 GB GDDR7 VRAM)がWindowsの最良候補 ― Llama 3.3 8B Q4で~70 tok/s。RTX 5070 Tiノート(~$2,499、12 GB VRAM)は~50 tok/sで予算重視の最適解。
RTX 5070 Tiノートで14Bモデルは実行できる?
はい。RTX 5070 Tiは12 GB VRAMで、Qwen3 14BをQ4で余裕を持って収められます。Q8(高品質)では14Bに~14 GB必要なので、14BをQ8で動かすにはRTX 5080(16 GB)が必要です。
ローカルLLMにはゲーミングノートとミニPCのどちらを買うべき?
ミニPC: より安く、速く、拡張性が高く、発熱も低い。ゲーミングノート: 携帯性はあるが熱制約あり。携帯性が必要ならMacBook Pro M5 ProかRTX 5080ノートを。机に据え置くなら、RTX 4060 Ti 16GB搭載デスクトップがどのノートより高性能で安価です。
Windowsゲーミングノートのバッテリーで7Bモデルは実行できる?
技術的には可能ですが、バッテリーではGPUがiGPUに切替わります。推論は2~4 tok/s(本格作業には実用不可)に低下。MacBook Pro M5 Proはバッテリーで~40 tok/sを出せ、バッテリー推論ははるかに快適です。
ローカルLLMに最適なAppleノートは?
ほとんどのユーザーにはMacBook Pro M5 Pro 14"($2,199、24 GB)。30B~70BモデルにはMacBook Pro M5 Max 14"($3,199~、36 GB)。70BをQ8で動かす研究者にはMacBook Pro M5 Max 16"($3,499~、64 GB)。
2023年のRTX 4070ノートは2026年にLLM用としてまだ買う価値がある?
中古で大幅に割引された場合のみ(eBayで$800~1,100)。新品のRTX 5070 Tiノート(~$2,499)はLLM推論で30~50%高速です。すでにRTX 4070ノートを所有しているなら、7B~13Bモデルは十分に動作します。
情報源
- NVIDIA RTX 50シリーズ モバイルGPU仕様(GeForce RTX 5080ノート、5070 Tiノート ― NVIDIA公式)
- Apple M5 Proチップ仕様とMacBook Pro M5 Pro価格(Apple.com、2026年6月)
- LLMベンチマークデータ: MacBook Pro M5 ProおよびRTX 5080ノートでのOllama 0.30.xベンチマーク
- TechPowerUp ノートパソコンGPUデータベース(2026年モバイルGPUモデル)