重要なポイント
- VRAMが決定的な制約です。 VRAMに収まらないモデルは読み込みに失敗するか、システムRAMにあふれて対話用途には遅すぎる状態になります。対象モデルにVRAMが合う価格帯を選び、その帯の中で速度を最適化してください。
- 価格は2026年に急騰しました。 メモリ不足がすべての市場でGPU価格をメーカー希望小売価格の1.5~2倍に押し上げました。RTX 5090は当初の発売価格ではなく約¥659,800です。本記事の価格はすべて2026年5月時点のスナップショットとして扱い、中古市場を活用してください。
- 低予算の選択:NVIDIA RTX 3060 12 GB(新品¥40,000前後、中古はさらに安い) — あらゆる7Bモデルを15~20 tok/sで動かし、ほとんどの13BモデルをQ4で動かします。2026年にローカルLLMを始める入口として最良のコストパフォーマンスです。
- 中位の選択:NVIDIA RTX 4060 Ti 16 GB(¥69,800前後) — 16 GBのVRAMはコンテキストの余裕を残して14Bモデルをこなし、メーカー希望小売価格に最も近いGPUであり、急騰の影響を最も受けていません。
- 上位の選択:NVIDIA RTX 4080 Super 16 GB(約¥290,000) — 最速の16 GBカードで、2026年の価格変動後はより遅いRTX 4070 Ti Superとほぼ同価格です。
- エンスージアストの選択:NVIDIA RTX 4090 24 GB / RTX 5090 32 GB — RTX 4090(新品¥375,000)は33Bモデルを動かし、RTX 5090(¥659,800)はデュアルGPU構成なしで70BモデルをQ4で収められる唯一のコンシューマーカードです。
- AMDは選択肢になりますが手間が増えます。 RX 6700 XT(12 GB)とRX 7800 XT(16 GB)は1円あたりのVRAMで競争力がありますが、ROCmのセットアップはNVIDIA CUDAに比べて数時間の作業が加わります。
- 消費電力は価格帯に比例します。 RTX 3060は170 W、RTX 5090は575 Wを消費し、850~1000 Wの電源が必要です。電源はカードと一緒に予算に入れてください。
クイックファクト
- 低予算帯: RTX 3060 12 GBまたはRX 6700 XT 12 GB — 7Bとほとんどの13Bモデルを動かす。
- 中位帯: RTX 4060 Ti 16 GBまたはRX 7800 XT 16 GB — 14Bモデルを余裕をもって動かす。
- 上位帯: RTX 4080 Super 16 GBまたはRTX 4070 Ti Super 16 GB — 高速な14B推論、軽めの22B作業。
- エンスージアスト帯: RTX 4090 24 GBまたはRTX 5090 32 GB — 33Bモデル、5090ではQ4で70B。
- Q4_K_MでのVRAMの目安: パラメータ10億あたり約0.6 GB、加えてコンテキストとツールに2~4 GB。
- 消費電力の範囲: RTX 3060 170 W、RTX 4060 Ti 165 W、RTX 4070 Ti Super 285 W、RTX 4080 Super 320 W、RTX 4090 450 W、RTX 5090 575 W。
- 2026年の価格の実情: メモリ不足が価格をメーカー希望小売価格の1.5~2倍に押し上げ、中古市場のほうがコストパフォーマンスで優れることが多い。
編集部の選択:RTX 4080 Super 16 GB
長く使えるカードを求め、¥150,000を超える予算を確保できる購入者には、NVIDIA RTX 4080 Super 16 GBがVRAM・速度・価格のバランスを取った選択肢です。 16 GBのVRAMはコンテキストの余裕を残してあらゆる14Bモデルをこなし、ここで最速の16 GBカードで約120 tok/s、約¥290,000で、2026年の価格変動後はより遅いRTX 4070 Ti Superとほぼ同価格です。これが上位帯で明確なコストパフォーマンスの選択となります。予算が¥90,000以下に固定されているなら、RTX 4060 Ti 16 GBがコストパフォーマンスの選択です — 2026年の急騰の影響が最も小さかったカードです。33Bや70Bモデルが特に必要な場合に限り、さらに支出してください。
📌Note: この編集部の選択は価格対性能のみを反映しています。PromptQuorumはいかなるアフィリエイトプログラムにも参加しておらず、以下のリンクにはアフィリエイトタグが付いていません。これらは手数料を生まない単なる参照リンクです。
2026年のローカルLLMで8枚のGPUを比較
VRAMと消費電力の数値はメーカー仕様です。RTX 3060、RTX 4080 Super、RTX 4090、RTX 5090の推論速度はPromptQuorumのハードウェアテストによる実測7B Q4の値で、RTX 4060 Ti 16 GB、RX 7800 XT、RTX 4070 Ti Superの数値はファミリー単位の推定値です。価格は2026年5月時点の日本のスナップショット(税込)です — 2026年のメモリ不足がメーカー希望小売価格の1.5~2倍に押し上げているため、購入前に再確認してください。
📍 一文で説明
ローカルLLMでは、GPUのVRAMが動かせるモデルを決め、トークン毎秒が答える速さを決めます — まず前者で選び、次に後者を最適化してください。
💬 簡潔に説明
VRAMを机の広さ、モデルをその上に置くものと考えてください。速いGPUは机を早く片付けますが、モデルがそもそも机に乗らなければ、速度は問題になりません。まず机が十分に大きい価格帯を選んでください。
| GPU | VRAM | 速度(7B Q4) | 消費電力 | 価格(2026年5月) | 最適な用途 |
|---|---|---|---|---|---|
| RTX 3060 12 GB | 12 GB | 15~20 tok/s | 170 W | 新品¥40,000前後 / 中古はさらに安い | 低予算の入口 — あらゆる7Bモデル |
| RX 6700 XT | 12 GB | 10~14 tok/s | 230 W | 新品¥44,000前後 | 最も安いVRAM、AMDのセットアップを許容 |
| RTX 4060 Ti 16 GB | 16 GB | 約20~25 tok/s | 165 W | ¥69,800前後 | 中位帯 — 14Bモデル、低消費電力 |
| RX 7800 XT | 16 GB | 約18~24 tok/s(推定) | 263 W | 新品¥56,000~75,000 | AMDで16 GB、ROCmのセットアップを許容 |
| RTX 4070 Ti Super | 16 GB | 約80~90 tok/s(推定) | 285 W | 約¥300,000 | 高速な14B、低めの消費電力 |
| RTX 4080 Super | 16 GB | 約120 tok/s | 320 W | 約¥290,000(新品) | 編集部の選択 — 最速の16 GB |
| RTX 4090 | 24 GB | 約150 tok/s | 450 W | 新品¥375,000 / 中古約¥290,000 | 33Bモデル、70B用のデュアルGPU |
| RTX 5090 | 32 GB | 約160 tok/s | 575 W | 新品¥659,800 | 1枚のGPUでQ4の70B |
どのGPUを買うべきか?
対象とする最大のモデルが価格帯を決め、その帯の中では予算がNVIDIAかAMDかを決めます。 自分の状況に合う行を見つけてください。
| あなたの状況 | これを買う |
|---|---|
| 予算は¥60,000未満で7Bモデルを動かしたい | RTX 3060 12 GB(中古) |
| LLMを動かせる最も安いカードがほしく、セットアップ作業を許容する | RX 6700 XT(中古) |
| 電力予算が厳しい中で14Bモデルを動かしたい | RTX 4060 Ti 16 GB |
| 14Bを高速に動かし数年もつカードがほしい | RTX 4070 Ti Super 16 GB |
| 最速の16 GBカードがほしく価格は二の次 | RTX 4080 Super 16 GB |
| 33Bモデルが必要、または将来のデュアルGPU 70B構成を計画している | RTX 4090 24 GB |
| 70BモデルをQ4で動かす1枚のカードが必要 | RTX 5090 32 GB |
| 迷っていて最も無難な最初のGPUがほしい | RTX 3060 12 GB — 物足りなくなったら後で買い替える |
低予算帯:RTX 3060 12 GBとRX 6700 XT
低予算帯はあらゆる7Bモデルとほとんどの13Bモデルを動かします。そして初めてローカルLLMを使う多くの人にとって、それが必要なすべての能力です。 RTX 3060 12 GBが推奨の選択肢で、AMDのセットアップの手間を許容できるならRX 6700 XTがより安い代替です。この帯では中古市場が最も重要です — 新品価格は2026年の急騰で大きく上がりました。
- RTX 3060 12 GB(新品¥40,000前後、中古はさらに安い): 12 GB VRAM、170 W、7BモデルをQ4で15~20 tok/s。Mistral 7B、Qwen3 8B、DeepSeek-R1 7B、ほとんどの13Bモデルを動かします。買うべきは12 GB版です — 3Bモデルに限られる6 GB版は避けてください。中古で買ってください — 新品在庫は生産終了で価格も高騰しています。
- RX 6700 XT(新品¥44,000前後): 12 GB VRAM、230 W、7Bモデルで10~14 tok/s。ローカルLLMへの最も安い入口ですが、RTX 3060より遅く、AMD ROCmに依存するためセットアップ時間が加わります。
- この帯を買う理由: 最も低い導入コスト、RTX 3060の低消費電力、そして一般的なチャット・コーディング支援・要約をカバーする7B~13Bモデルに十分なVRAM。
- この帯を避ける理由: 14B以上のモデルがほしいとすでに分かっているなら、低予算帯は数週間で物足りなくなります — 代わりに中位帯から始めてください。
💡Tip: RTX 3060は必ず12 GB版を買ってください。6 GB版のRTX 3060は出品では似て見えますが3Bモデルしか収まりません — パラメータ数が半分というのは、使えるアシスタントとおもちゃの違いです。
⚠️Warning: RX 6700 XTはここで最も安いカードですが、LinuxでのROCmセットアップに3~5時間を見込んでください。中古RTX 3060に対して節約できる金額より自分の時間のほうが価値があるなら、NVIDIAのカードを買ってください。
中位帯:RTX 4060 Ti 16 GBとRX 7800 XT
中位帯はひとつの理由のために存在します。16 GBのVRAMは、12 GBカードでは実用的なコンテキストとともに収められない14Bモデルをこなします。 14Bクラスのモデルが対象なら、これがそれらを適切に動かす最も安い帯です — そしてRTX 4060 Ti 16 GBは、2026年の急騰を通じてもメーカー希望小売価格に近いままという点で注目に値します。
- RTX 4060 Ti 16 GB(¥69,800前後): 16 GB VRAM、165 W、7Bモデルで約20~25 tok/s。8 GB版RTX 4060 Tiと同じGPUダイを使うため、トークンあたりの速度は同等です — 16 GB版は速度ではなく容量を買うものです。165 Wという消費電力は、能力に対して本ガイドで最も低く、急騰の影響も最も小さいGPUです。
- RX 7800 XT(新品¥56,000~75,000): 16 GB VRAM、263 W。本ガイドでは個別に計測していません。速度はRTX 4060 Tiの範囲を見込み、AMD ROCmのセットアップが引き換えになります。
- この帯を買う理由: 14Bモデルがほしい、低消費電力がほしい(RTX 4060 Ti)、または可能な限り安く16 GBがほしい。
- この帯を避ける理由: 7Bモデルで足りるなら低予算帯が¥30,000ほど節約でき、高速な14B推論がほしいなら上位帯のほうが明確に速いです。
📌Note: RTX 4060 Ti 16 GBは8 GB版に対する容量のアップグレードであり、速度のアップグレードではありません。トークン毎秒の増加を期待してではなく、14Bモデルを収める必要があるから買ってください。
上位帯:RTX 4080 SuperとRTX 4070 Ti Super
上位帯は16 GBのVRAMを保ちつつ、7B~14Bモデルを瞬時に感じさせ22Bモデルを実用的にする速度を加えます。 両カードとも中位帯と同じモデルを収めます — 容量ではなくトークン毎秒に対して支払っているのです。2026年の急騰はこの帯と中位帯の差を大きく広げました。
- RTX 4080 Super 16 GB(約¥290,000): 16 GB VRAM、320 W、7Bモデルで約120 tok/s。編集部の選択 — 最速の16 GBカードで、2026年の価格変動後はより遅いRTX 4070 Ti Superとほぼ同価格です。
- RTX 4070 Ti Super 16 GB(約¥300,000): 16 GB VRAM、285 W。ほぼ同じ新品価格でRTX 4080 Superよりわずかに遅いです — 285 Wという低めの消費電力のために選ぶか、最も安い高速16 GBカードとして中古で買ってください。
- この帯を買う理由: 14Bモデルを常に動かし瞬時の応答がほしい、または軽めの22B作業をして余裕がほしい。
- この帯を避ける理由: 33Bや70Bモデルが必要なら、どの16 GBカードもそれらを収められません — ここで使いすぎる代わりにエンスージアスト帯へ移ってください。
💡Tip: この帯では既定でRTX 4080 Superを選んでください — ほぼ同じ新品価格で、RTX 4070 Ti Superより明確に速いです。約35 Wの消費電力を節約したい場合、または中古で割安に買える場合に限り4070 Ti Superを選んでください。
エンスージアスト帯:RTX 4090とRTX 5090
エンスージアスト帯は22Bを超えるモデルを動かせる唯一の帯であり、RTX 5090 32 GBは70BモデルをQ4で収められる唯一のコンシューマーカードです。 ここでは速度ではなくVRAM容量のために買ってください。速度は副産物です。2026年の急騰はこの帯を最も激しく直撃したため、価格は週ごとに動きます。
- RTX 4090 24 GB(新品¥375,000 / 中古約¥290,000): 24 GB VRAM、450 W、7Bモデルで約150 tok/s、70B Q4モデルで36 tok/s。33Bモデルを余裕をもって動かします。なお、急騰により中古RTX 4090の価格は新品RTX 5090に近づいています。
- RTX 5090 32 GB(新品¥659,800): 32 GB GDDR7 VRAM、575 W、7Bで約160 tok/s、70B Q4で45 tok/s。32 GBの容量が目玉です — 2枚目のGPUなしで70BモデルをQ4で動かせる唯一のコンシューマーカードです。
- この帯を買う理由: 33Bや70Bモデルが必要、バッチ推論を行う、または何年も買い替え不要のカードがほしい。
- この帯を避ける理由: 7B~14Bモデルには過剰です — 上位帯はそれらのサイズで、価格と消費電力の半分以下で瞬時の応答を提供します。
⚠️Warning: RTX 5090は単体で575 Wを消費します。850~1000 Wの電源と組み合わせてください — 750 Wのユニットは負荷時にへたります。電源のアップグレードは後回しではなく購入に組み込んで予算化してください。
📌Note: 2026年の急騰前は、中古RTX 4090を2枚買うほうがRTX 5090 1枚より安価でした。それが逆転しました。1枚あたり約¥290,000~375,000のため、RTX 4090を2枚揃えると今ではRTX 5090 1枚をかなり上回ります。新規の70B構成では、RTX 5090 1枚のほうが今や簡単で安価です。
VRAMはどれくらい必要か?
Q4_K_M量子化では、モデルはパラメータ10億あたり約0.6 GBのVRAMに加え、コンテキストとツールのオーバーヘッドに2~4 GBを必要とします。 この式は4つの価格帯に直接対応します。
- 7Bモデル — 8~9 GB: どの帯にも収まります。12 GBカードなら余裕があります。
- 13~14Bモデル — 11~13 GB: コンテキストとツールを数えると実際には16 GBが必要です。中位帯以上。
- 22Bモデル — 14~16 GB: 16 GBカードでは厳しく、上位帯以上で余裕があります。
- 33Bモデル — 19~22 GB: 24 GBカードが必要です。RTX 4090の領域です。
- 70Bモデル — Q4で39~42 GB: RTX 5090 32 GBを限界まで使うか、デュアルGPU構成が必要です。1枚の24 GBカードでは70BモデルをQ4で収められません。
💡Tip: コンテキスト長は隠れたVRAMコストです — 長いプロンプトや大きなコンテキストウィンドウは、モデルの重みに加えてVRAMを消費します。常に2~4 GBの余裕を残してください。完全な方法は関連記事にあるVRAM要件ガイドを参照してください。
なぜGPU価格は2026年に急騰したか
GPU価格はメモリ不足のため2026年に急騰し、コンシューマーカードを当初のメーカー希望小売価格の1.5~2倍に押し上げました。 これは購入の計算を変えるため、発売価格ではなくこれを前提に計画してください。
📍 一文で説明
2026年のGPU価格はメモリチップ不足のためメーカー希望小売価格の1.5~2倍であり、ローカルLLMの購入者は中古市場と、対象モデルに合う最小のカードを優先すべきです。
💬 簡潔に説明
カードが良くなったわけではありません — その中のメモリが希少で高価になったのです。これが緩和するまで、メーカー希望小売価格は過去の数字として扱い、可能なら中古で買い、モデルが実際に必要とする以上のVRAMにお金を払わないでください。
- 原因はGPUではなくメモリです。 GDDRとHBMの供給不足が、高速メモリを積むあらゆるカードのコストを上げました — そしてLLM対応GPUは、まさに最も影響を受ける高VRAMカードです。
- RTX 5090が最も明確な例です: 発売価格は1,999ドルでしたが、2026年5月の店頭では約¥659,800 — ほぼ倍です。
- 下位のカードはより持ちこたえました。 RTX 4060 Ti 16 GBはメーカー希望小売価格に近い水準にあります。急騰はカードが積む高速メモリの量に比例します。
- 今や中古市場がコストパフォーマンスの選択です。 中古のRTX 3060 12 GBやRX 6700 XTは急騰の大半を免れます — 中古価格は新品価格よりはるかに上昇が小さいです。
- 判断: 待てるなら不足の緩和を見守り、待てないなら可能な限り中古で買い、対象モデルに合う最小のカードを買ってください。
判断フローチャート:4つの質問でGPUを選ぶ
4つの質問を順に答えると、ほとんどの購入者は1枚のカードに行き着きます。
📍 一文で説明
ローカルLLM向けのGPUは、最初に最大のモデルサイズ、次に予算の上限、次にNVIDIA対AMD、最後に電源の余裕を答えることで選んでください。
💬 簡潔に説明
実際に動かしたい最大のモデルから始め、それに価格帯を決めさせてください。価格・ブランド・電源がカードに対応できるかを見るのは、その後だけです。逆の順序で進めるのが、使いすぎたり、自分のモデルを動かせないカードを買ったりする原因です。
- 1. 動かしたい最大のモデルは何ですか? 7B:低予算帯。14B:中位帯。22B:上位帯。33B:RTX 4090。70B:RTX 5090またはデュアルGPU。
- 2. 動かせない予算の上限はいくらですか? 約¥40,000未満(中古):RTX 3060 12 GB。¥90,000未満:RTX 4060 Ti 16 GB。約¥290,000~300,000:RTX 4080 SuperまたはRTX 4070 Ti Super。¥375,000以上:RTX 4090またはRTX 5090。
- 3. NVIDIAかAMDか? すでにAMDのハードウェアを持っているか、RX 7800 XTの大幅な値引きを見つけた場合を除き、NVIDIAを選んでください — CUDAは数時間のROCmセットアップを省きます。
- 4. 電源に余裕がありますか? 中位帯を超えるカードは285~575 Wを必要とします。エンスージアスト帯のハードウェアを買う前に、電源とケースの冷却を確認してください。
地域別価格と購入先
GPU価格は地域によって異なります — ここでの価格は2026年5月時点の日本のスナップショット(消費税込)であり、2026年の急騰はあらゆる市場を直撃しました。 以下のリンクは単なる製品検索リンクで、アフィリエイトタグは付いておらず、手数料を生みません。
- 日本: Amazon.co.jpとドスパラ・パソコン工房・TSUKUMOがグラフィックカードの主な購入先です。
- 価格比較: Kakaku.com(価格.com)は日本で新品価格を比較する標準であり、現在最も安い購入先をそこで確認してください。
- 自作系ショップ: アーク(ark)やArkなどの自作PC専門店は、ハイエンドGPUの在庫がオンライン小売より早く入ることがあります。
- 中古: メルカリやヤフオク!は日本のGPUの主な中古市場です — 特にRTX 3060のような古いカードでは大幅に安い選択肢になることが多いです。
- 在庫状況: ハイエンドカード(RTX 4090、RTX 5090)は2026年には時折品薄で、価格は変動し、為替の影響も受けます。複数の小売店を確認してください。
⚠️Warning: 2026年の急騰のため、本ガイドのすべての価格は変動の速い2026年5月時点のスナップショットです。購入前に必ず現在の小売店の出品を開いてください — 価格は週ごとに動いています。
ローカルLLM向けGPU購入でよくある間違い
- VRAMではなくトークン毎秒で買う。 モデルを収められない速いカードは役に立ちません。まずモデルが2~4 GBの余裕とともにVRAMに収まることを確認し、その帯の中で速度を比較してください。
- 12 GB版ではなく6 GB版のRTX 3060を買う。 名前は共通でも用途は別です — 6 GBカードは3Bモデルが上限です。出品では必ず12 GB版であることを確認してください。
- RTX 4060 Ti 16 GBが8 GB版より速いと思い込む。 速くありません — メモリが多いだけの同じGPUダイです。速度ではなく容量(14Bモデル)のために買ってください。
- 現在価格ではなくメーカー希望小売価格を基準にする。 2026年の急騰により、発売価格はもはや実態を反映しません。小売店のリアルタイム価格で予算を組み、急騰を免れる中古市場を優先してください。
- 電源要件を無視する。 RTX 5090は575 Wを消費し、850~1000 Wの電源が必要です。負荷時に電圧が落ちるカードは、安定して動く遅いカードより劣ります。
- セットアップ時間を見込まずにAMDを選ぶ。 RX 6700 XTとRX 7800 XTはコストパフォーマンスが良いですが、ROCmのセットアップに数時間かかります。その時間をNVIDIAカードに対して節約できる金額と比べてください。
- 7Bモデルのために過剰投資する。 7Bモデルで用途が足りるなら、RTX 4090はお金と電力の無駄です。たまたまある予算ではなく、モデルに価格帯を合わせてください。
出典
- NVIDIA GeForce RTX 40シリーズ 仕様 — RTX 4060 Ti、4070 Ti Super、4080 Super、4090の公式VRAM容量と消費電力(TGP)。
- NVIDIA GeForce RTX 5090 仕様 — RTX 5090の公式32 GB GDDR7 VRAMと575 W消費電力。
- Best Value GPU — RTX 5090 / 4090 / 4080 Super 価格トラッカー — 2026年5月の価格スナップショットに使用した米国の新品・中古価格履歴。
- AMD Radeon 仕様 — RX 7800 XTとRX 6700 XTの公式VRAMと消費電力。
- ローカルLLM向けベストGPU 2026 — PromptQuorumのハードウェアテスト:RTX 3060、4080、4090、5090の実測7B Q4推論速度。
FAQ
ローカルLLMをうまく動かせる最も安いGPUは何ですか?
中古のNVIDIA RTX 3060 12 GBが、ローカルLLMをうまく動かせる最も安いGPUです。12 GBのVRAMはあらゆる7Bモデルとほとんどの13BモデルをQ4量子化で、15~20トークン毎秒で収めます。より安いRX 6700 XTでも動きますが、より遅く、AMD ROCmのセットアップが必要です。中古で買ってください — 新品価格は2026年の急騰でおよそ倍になりました。
なぜ2026年のGPU価格はこれほど高いのですか?
メモリチップ不足が2026年のGPU価格急騰を引き起こしました。GDDRとHBMの供給が逼迫し、高速メモリを積むあらゆるグラフィックカードのコストが上がり、高VRAMでLLM対応のカードが最も激しく直撃されました。2026年5月時点で、ほとんどのカードは当初のメーカー希望小売価格の1.5~2倍で売られています — RTX 5090は1,999ドルで発売されましたが約¥659,800で取引されています。中古市場は値上がりの大半を免れました。
ローカルLLMにはどれくらいのVRAMが必要ですか?
Q4_K_M量子化では、パラメータ10億あたり約0.6 GBのVRAMに2~4 GBのオーバーヘッドを加えて見積もってください。これは7Bモデルで8~9 GB、14Bで11~13 GB、33Bで19~22 GB、70Bで39~42 GBを意味します。12 GBカードは7Bを余裕でカバーし、70BにはRTX 5090 32 GBかデュアルGPU構成が必要です。
RTX 4060 Ti 16 GBは8 GB版より速いですか?
いいえ。RTX 4060 Ti 16 GBと8 GB版は同じGPUダイを使うため、トークンあたりの推論速度は同等です — 7Bモデルで約20~25トークン毎秒です。16 GB版は容量を買うもので、8 GBに収まらない14Bモデルを動かせるようにします。速度ではなくVRAMのために買ってください。
ローカルLLMにはNVIDIAとAMDのどちらを買うべきですか?
すでにAMDのハードウェアを持っているか、大幅な値引きを見つけた場合を除き、NVIDIAを買ってください。NVIDIA CUDAはOllama、LM Studio、llama.cppですぐに動きます。RX 6700 XTやRX 7800 XTといったAMDカードは1円あたりのVRAMで競争力がありますが、ROCmのセットアップはLinuxで通常数時間かかります。
1枚のGPUで70Bモデルを動かせますか?
RTX 5090 32 GBのみで、しかも70Bモデルが約39~42 GBを必要とするQ4量子化でのみです — つまり積極的な量子化または部分的なオフロードを意味します。24 GBのRTX 4090は70BモデルをQ4で単独では収められません。一般的な解決策はVRAMを合算するためのRTX 4090 2枚ですが、2026年の価格急騰によりこのペアはRTX 5090 1枚より高くなっています。
ローカルLLMでRTX 5090はRTX 4090に対して価値がありますか?
70Bモデルを1枚のカードで動かす必要が特にある場合に限ります。RTX 5090はRTX 4090の24 GBに対して32 GBのVRAMを持ち、これが決め手です。7B~33BモデルではRTX 4090も同じモデルを収めます。2026年の急騰後は両者の価格が近いため、予算が許すなら5090の追加8 GBとわずかに高い速度が新規購入としてより良い選択になります。
これらのGPUにはどの電源が必要ですか?
電源を価格帯に合わせてください:550 WのユニットはRTX 3060に、650~750 WはRTX 4060 Tiと4070 Ti Superに、850 WはRTX 4090に適し、単体で575 Wを消費するRTX 5090には850~1000 Wが必要です。容量不足の電源は負荷時に不安定を引き起こします。