DeepSeekを完全オフライン・セルフホストで実行するには？

オープンウェイトのDeepSeek-R1 distillを一度プルし、その後OllamaまたはLM Studioで実行してネットワークアクセスを遮断します。モデルは完全にローカルハードウェア上で動くため、ホスト型APIもグレートファイアウォールへの依存も関係ありません。中国語の作業にはQwen2.5ベースのdistillを選び、トラフィック監視でオフライン状態を検証します。

ホーム/ローカルLLM活用/DeepSeekをオフライン実行 2026：セルフホスト・ファイアウォール不要

Overview & Reference

DeepSeekをオフライン実行 2026：セルフホスト・ファイアウォール不要

最終更新: 2026-06-19·11分で読める·Hans Kuepper 著 · PromptQuorumの創設者、マルチモデルAIディスパッチツール · PromptQuorum

言語を選択:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

DeepSeekを完全オフラインで実行するには、オープンウェイトのDeepSeek-R1 distillをダウンロードし、自分が管理するハードウェア上でOllamaまたはLM Studioで動かし、ネットワークアクセスをブロックします — APIなし、ファイアウォール回避なし、マシン外へのデータ流出なしです。中国語推論には、Llamaベースより中国語を得意とするQwen2.5ベースのdistill（7B/14B/32B）を推奨します。セッション中の送信トラフィックを監視して「オフライン」を検証してください。

DeepSeekの推論モデルを完全オフラインで実行します — APIなし、グレートファイアウォールへの依存なし、完全なデータ管理。本ガイドでは、中国語推論向けのDeepSeekモデル選定、ハードウェア階層、OllamaとLM Studioでのオフラインセットアップ、そしてデプロイが本当にオフラインかの検証方法を扱います。ネットワークとファイアウォールの仕組みはリンクで案内し、重複させません。

このページには参考用の第三者製品へのリンクが含まれています。PromptQuorumはいかなるアフィリエイトプログラムにも参加しておらず、これらはコミッションを得ない単なる参照リンクです。リンクのクリックと次のステップはご自身の責任です。これらのリンクはPromptQuorumによる推奨や検証を表すものではありません。

重要なポイント

DeepSeek-R1 distillがネットワークを必要とするのは一度だけ（ダウンロード時）です。推論時は完全オフラインで動きます。
中国語推論では、Qwen2.5ベースのdistill（1.5B/7B/14B/32B）がLlama 3ベースの8B/70Bより中国語を得意とします。
ハードウェアをモデルに合わせる：16 GB → 14B、24 GB → 32B；GPUごとの完全な対応はBiteリファレンスにあります。
ここでのセットアップはモデル側のみ — OllamaまたはLM Studio。ネットワーク/ファイアウォールの仕組みは重複回避のためリンクで案内します。
「オフライン」を実証的に検証：ネットワークを遮断するか、セッション中の送信トラフィックを監視して送信ゼロを確認します。
オフラインのセルフホストはグレートファイアウォールへの依存がなく、国境を越えるデータフローもありません。
すべてのdistillをtemperature 0.6、システムプロンプトなしで実行します。

なぜDeepSeekをオフラインで実行するのか？

DeepSeekをオフラインで実行すると、完全なデータ管理が得られ、ホスト型APIやネットワーク状況への依存がなくなります — モデルはローカルハードウェアから回答し、マシン外へ何も出ません。主権が重視される作業では、これは「自分が管理するツール」と「依存するサービス」の違いです。

このセクションでは主な動機を3つ挙げます：データ主権（プロンプトと出力が環境外に出ない）、信頼性（ホスト型エンドポイントの障害やレート制限がない）、ネットワーク制限からの独立です。最後の点はグレートファイアウォールの背後にいるユーザーにとって具体的です：オフラインモデルには到達すべき海外エンドポイントがないため、海外サービスへの接続性は無関係です。

これはローカルDeepSeekは中国のデータ問題を解決するか？のプライバシー分析の実践的な対になります — あちらのページはローカルのセルフホストがなぜデータフローの懸念を取り除くかを説明し、こちらはその構築方法を示します。

📍 一文で説明

DeepSeekをオフラインで実行すると、すべてのプロンプトと出力がローカルハードウェアにとどまり、ホスト型APIへの依存とあらゆるネットワーク制限がなくなります。

💬 簡潔に説明

オフラインモデルは、訪れるウェブサイトに対して、自分が所有する本のようなものです。一度棚に並べば、読むのにインターネットも誰かの許可も要りません。

中国語推論にはどのDeepSeek distillが最適か？

中国語推論には、Qwen2.5ベースのDeepSeek-R1 distill（7B、14B、または32B）を選びます — Qwen2.5は中国語カバレッジが強く訓練されているため、これらのdistillはLlama 3ベースの8Bや70Bより中国語のプロンプトと出力を明らかに得意とします。推論の挙動はdistill間で同じで、言語品質を決めるのはベースモデルです。

中国語ワークロード向けの実用的な選択：16 GBカード上の14Bがバランスの取れた既定値で、24 GBカード上の32Bが最強の単一GPUオプションです。どちらもQwen2.5ベースのおかげで中国語を流暢に推論します。Llamaベースのdistillは、英語中心の作業やLlamaライセンス要件のために取っておきます。

本機能が応えるヘッドクエリ：本地部署 deepseek（DeepSeekをローカル展開）、deepseek 离线（DeepSeekオフライン）、deepseek 私有化部署（DeepSeekのプライベート展開）。3つすべての答えは同じ — OllamaまたはLM Studioでローカル実行するQwen2.5ベースのdistillです。

📍 一文で説明

中国語推論には、Qwen2.5ベースのDeepSeek-R1 distill（7B/14B/32B）を選びます；QwenベースはLlamaベースのdistillより中国語をはるかに得意とします。

どんなハードウェアが必要か？

distillをVRAMに合わせます — どのDeepSeek-R1デプロイとも同じ階層です。これは簡略版で、2つのBiteリファレンスにGPUごとの完全な表とquantごとのVRAMがあります。

VRAM	最適なdistill（オフライン）	備考
8 GB	7B または R1-0528-Qwen3-8B	エントリー階層；0528-Qwen3-8Bが最良の小型推論
16 GB	14B (Qwen2.5)	バランス型の既定、中国語に強い
24 GB	32B (Qwen2.5)	最良の単一GPU；o1-miniを上回る
デュアルGPU / 48 GB	70B (Llama 3)	最高精度；中国語は弱め

常時稼働で低消費電力のオフラインエンドポイントには、Minisforum mini-PCが7Bと14Bのdistillを静かに実行します。正確なGPU対応は関連ガイドのBiteリファレンスを参照してください。

AmazonのMinisforum mini-PC（製品リンク・開示済み）製品リンク · 開示済み

DeepSeekをオフラインでどう設定するか？

オフラインセットアップはモデル側のみです：一度ダウンロードし、その後ネットワークなしで実行します。以下はOllamaでの手順です（LM StudioはGUI版 — モデルをプルしてからオフラインにします）。

1
OllamaまたはLM Studioをインストール
Why it matters: これらは推論時に外部依存なくモデルをローカル実行します；オンラインで一度インストールします。
2
distillを一度プル
Why it matters: 接続状態で`ollama run deepseek-r1:14b`（または該当階層）を実行 — ネットワークが必要なのはこの手順だけです。
3
ネットワークを切断またはブロック
Why it matters: モデルがキャッシュされたら、ネットワークアクセスを遮断します；モデルはローカルの重みだけで回答を提供します。
4
temperatureを0.6に設定し、システムプロンプトをクリア
Why it matters: R1の繰り返し障害モードを防ぎます；すべての指示はユーザープロンプトに入れます。
5
オフラインで推論を実行
Why it matters: すべてのプロンプトと出力が送信なしでマシン内にとどまります — 下の検証手順で確認します。

bash

ollama pull deepseek-r1:14b    # 一度だけ、オンライン
# その後ネットワークを切断 / ブロック
ollama run deepseek-r1:14b     # 完全オフライン推論

ネットワークとファイアウォールの仕組みは？

オフラインモデル自体はファイアウォール設定、VPN、ネットワークトンネリングを必要としません — 到達すべき海外エンドポイントがないため — よって唯一のネットワーク作業は、マシン上の他のものが外部通信しないようにすることだけです。その一般的なトピック（ファイアウォールルール、エアギャップ、送信接続のブロック）は別の場所で詳しく扱い、ここでは重複させません。

ファイアウォールとオフラインネットワークの完全なセットアップ — ワークステーションのエアギャップ化や送信トラフィックのロックダウンを含む — はファイアウォール越しのローカルAI：オフライン 2026を参照してください。本記事はDeepSeekのモデル選定とオフラインモデルのセットアップを扱い、あちらはネットワークの仕組みを扱います。

本当にオフラインかをどう検証するか？

オフライン状態を実証的に証明します：送信トラフィックを監視するかネットワークを無効にした状態で完全な推論セッションを実行し、モデルプロセスからの送信接続がゼロであることを確認します。推測せず実証してください — それが主権の主張を監査可能にするものだからです。

簡単な方法は2つ：ネットワークアダプターを無効化（またはケーブルを抜く）して推論がなお動くことを確認 — モデルが接続性を必要としない証拠です；あるいはネットワークは有効のまま、パケットキャプチャやプロセス別ファイアウォールで送信接続を監視し、セッション中にOllama/LM Studioプロセスが1つも開かないことを確認します。

設定のコツ：temperature 0.6、システムプロンプトなし

temperatureを0.6に設定し（0.5–0.7が安全）、システムプロンプトを使わず — すべての指示をユーザープロンプトに入れます。 これはDeepSeek-R1 distillが陥りやすい繰り返しと非整合の障害モードを回避し、オフラインでもオンラインと同じくらい重要です。

よくある質問

DeepSeekをローカルで動かすのにインターネットは必要ですか？

モデルのダウンロード時に一度だけです。distillがキャッシュされた後は推論が完全オフラインで動きます — ネットワークを切断・ブロックしてもローカルの重みから動作し続けます。

中国語にはどのDeepSeek distillが最適ですか？

Qwen2.5ベースのdistill（7B、14B、または32B）です。Qwen2.5は中国語カバレッジが強いため、Llama 3ベースの8Bや70B distillより中国語のプロンプトと出力を得意とします。

中国でDeepSeekをオフライン実行するのにVPNやファイアウォール回避は必要ですか？

いいえ。オフラインモデルには到達すべき海外エンドポイントがないため、VPNやファイアウォール回避は推論に無関係です。唯一のネットワーク作業は、マシン上の他のものがデータを外部送信しないようにすることです。

オフラインモデルがどこにもデータを送らないとどう確認しますか？

セッション中の送信トラフィックを監視するか、ネットワークを完全に無効化して推論がなお動くことを確認します。DeepSeekのオープンウェイトにはテレメトリがないため、モデルプロセスからの送信接続はゼロのはずです。

どんなハードウェアがDeepSeekのオフライン実行に向いていますか？

16 GBのGPUは14B distillを、24 GBのGPUは32Bを動かします。静かな常時稼働エンドポイントには、Minisforum mini-PCが7Bと14Bを扱います。正確な対応はGPUおよびVRAMのBiteを参照してください。

フルのDeepSeek-R1をオフラインで動かせますか？

コンシューマー向けハードウェアでは無理です。フルの671B R1はQ4で約376–404 GBのVRAMを必要とします。オフラインのセルフホストはローカルGPUで動くdistill（1.5B–70B）を使います。

ファイアウォールとネットワークの手順はどこにありますか？

本ガイドはファイアウォールとエアギャップの仕組みを意図的に再説明しません。完全なネットワークロックダウンはファイアウォール越しのローカルAI：オフライン 2026を参照してください；ここではDeepSeekのモデル選定とオフラインモデルのセットアップを扱います。

オフラインDeepSeekにはどの設定を使うべきですか？

temperature 0.6、システムプロンプトなし、指示はユーザーメッセージに。これは標準のDeepSeek-R1設定で、繰り返し障害モードを防ぎます。

更新ログ

2026-06-19公開。次回レビュー予定は2026-12-19（半期フレッシュネス階層）。
DeepSeekのオフラインモデル選定、中国語モデルの選択、オフラインモデルのセットアップを扱います。ネットワーク/ファイアウォールの仕組みは意図的にリンクで案内。軽いアフィリエイト：mini-PCのみ。

← ローカルLLM活用に戻る