Skip to main content
PromptQuorumPromptQuorum

2 GB RAMでRAGを実行できますか?

クイック回答

はい — ただし小規模な個人ドキュメントセット限定です。2 GB RAMでは、Llama 3.2 1B(~750 MB)にMiniLM-L6-v2 Embeddings(~80 MB)とインメモリベクターストアを組み合わせた実用的なRAGパイプラインが可能です。合計~1.3–1.5 GBは2 GBデバイスに収まります。大型モデル(7B+)や大きなドキュメントセット(200ページ以上)には最低8 GBが必要です。

  • Llama 3.2 1B Q4_K_M(~750 MB)+ MiniLM-L6-v2 Embeddings(~80 MB)が2 GBに収まる
  • ドキュメントセットはRAM内に収めるために~200ページ未満に制限する必要がある
  • 7B+モデルや大きなコーパスには最低8 GB RAMが必要

更新: 2026-05

Quick Answers

はい — ただし最小限のセットアップのみ機能します

2 GB RAMでは、唯一実用的なRAGパイプラインは1BクラスのLLM(Llama 3.2 1BまたはPhi-3 Mini)と軽量な埋め込みモデル(MiniLM-L6-v2、~80 MB)とフラットファイルまたはインメモリベクターストアを組み合わせたものです。2026年5月現在、これは機能します — ただし小規模な個人ドキュメントセット(~200ページ未満)限定です。

以下の表は最小限の設定における各RAGコンポーネントのRAM使用量を示しています。

コンポーネントメモリ使用量備考
LLM(Llama 3.2 1B Q4_K_M)~750 MB最小の実用的なinstruction-tunedモデル
埋め込みモデル(MiniLM-L6-v2)~80 MBCPU上で動作;GPU不要
ベクターストア(Chroma in-memory)~150 MBコーパスサイズに合わせてスケール
Pythonランタイム + フレームワークオーバーヘッド~300 MBLangChainまたは最小限のllama-index
合計最小値~1.3–1.5 GB2 GBデバイスのOSに~500 MBを残す

2 GBで失敗するもの

最も一般的な失敗は、コンテキストウィンドウ拡張時にLLMが利用可能なRAMを超えることです。 2 GBでは、1Bモデルのコンテキストはオペレーティングシステムがスワッピングを開始する前に約2kトークンに制限されます。7B以上のモデルのロードは即座に失敗します — Llama 3 8B Q4_K_Mだけで~5 GBが必要です。

2番目の失敗パターンはベクターストアの成長です。500ページのPDF用のChromaデータベースはチャンクサイズによって約400–600 MBを使用します。LLMと埋め込みモデルと合わせると、合計RAMが2 GBを超えます。解決策:インジェストを150ページ未満に制限し、256トークンチャンクを使用し、各セッション後にストアをプルーニングします。

2 GB RAMでのRAGに関するよくある質問

RAGに機能する最小のLLMは何ですか?
Llama 3.2 1B Q4_K_M(~750 MB)は、検索拡張タスクに対して一貫した回答を生成する最小のinstruction-tunedモデルです。3–4 GBが利用できる場合はPhi-3 Mini(3.8B)がより良い選択です — その4kコンテキストはより長い検索済みパッセージを処理します。1B未満のパラメータでは、RAGスタイルの質問応答の出力品質が急激に低下します。
Ollamaを2 GB RAMで使用できますか?
Ollamaの推奨最低RAMは8 GBです。2 GBではOllama自体はロードされますが、モデルのサービングが失敗するかスワップを大量に使用します。2 GBデバイスには、CLIまたはllama-cpp-pythonバインディングを通じてllama.cppを直接使用してください — これらはOllamaサーバープロセスよりも常駐メモリフットプリントが小さいです。
Raspberry Pi 5(8 GB)は適切なRAGを実行できますか?
はい。8 GB RAMを持つRaspberry Pi 5は、完全な埋め込み + ベクターストアスタックとともにLlama 3 8B Q4_K_M(~5 GB)を余裕を持って実行できます。速度はPi 5 CPUで~1–2 tok/sです — オフライン個人検索ユースケースには遅いですが機能的です。スピードベンチマークについてはCPU専用推論のための最良のOllamaモデルを参照してください。
2 GB RAMでのローカルRAGは価値がありますか?
小規模な個人ドキュメントセット(ノート、いくつかのPDF)には、1B + MiniLMパイプラインは本当に有用です。大規模コーパスにわたる精確な検索や複雑な多段階推論が必要なものには、2 GB RAMは厳しい制約です。プロダクションレベルのRAG品質を期待する前に、少なくとも8 GBにアップグレードしてください。