Skip to main content
PromptQuorumPromptQuorum
ホーム/Power Local LLM/WeChat + ローカルLLM統合:開発者ガイド 2026
Local AI Agents & Tool Use

WeChat + ローカルLLM統合:開発者ガイド 2026

·11分で読める·Hans Kuepper 著 · PromptQuorumの創設者、マルチモデルAIディスパッチツール · PromptQuorum

WeChatをローカルLLMに接続するには、ミニPC上でOllamaを実行し、WeChatFerry(Windows版)でWeChat PCクライアントのメッセージをインターセプトし、PythonブリッジでOllama HTTP APIにルーティングします。中国語チャットにはQwen2.5 7B Q4_K_Mを推奨します。

WeChatをローカルLLMに接続することで、世界最大のメッセージングアプリでプライベートなAIアシスタントが利用可能になります。クラウドAPIへのデータ送信は一切不要です。このガイドでは3つの統合パターン、中国語テキスト向けモデル選択、個人情報保護法対応について解説します。

スライドデッキ: WeChat + ローカルLLM統合:開発者ガイド 2026

この記事のインタラクティブスライド。

以下のスライドを閲覧するか、PDFとしてダウンロードしてください。 リファレンスカードをダウンロード(PDF)

重要なポイント

  • WeChatFerry(Windows)は2026年で最も信頼性の高いWeChat PCフック
  • OllamaはポートI11434でローカルHTTP APIを公開——10行のPythonでルーティング可能
  • Qwen2.5 7B Q4_K_M:中国語チャットに推奨——5.5 GB VRAM、ネイティブCJKトークン化
  • Always-onミニPCサーバー(Minisforum UM890 Pro、約35 W)——24/7稼働
  • ローカル推論:個人情報保護法対応——データは自分のデバイスから出ない

WeChat + LLM 3つの統合パターン

パターン1 — WeChatFerry + Ollama(Windows): 最も安定。WeChatFerryがWeChat PCクライアントにフックし、Python SDKを公開。個人チャットとグループチャット両方に対応。

パターン2 — HTTPウェブフックブリッジ: クロスプラットフォーム対応だがセットアップが複雑。WeChat公式アカウントインフラを持つ企業向け。

パターン3 — Ollama + Open WebUI: 最もシンプルな一方向通知オプション。フック不要。

WeChatFerryセットアップ:ステップバイステップ

  1. 1
    WeChat PC(weixin.qq.comの公式版)をWindowsにインストール
  2. 2
    WeChatFerryをインストール:pip install wcferry(Python 3.10+)
  3. 3
    WeChatFerryデーモン起動:python -m wcferry.daemon
  4. 4
    メッセージハンドラーを作成し、localhost:11434へルーティング
  5. 5
    返信送信:wcf.send_text(response, msg.roomid or msg.sender)
python
import requests
from wcferry import Wcf

wcf = Wcf()
wcf.enable_receiving_msg()

while True:
    msg = wcf.get_msg()
    if msg and msg.from_self() is False:
        resp = requests.post(
            "http://localhost:11434/api/generate",
            json={"model": "qwen2.5:7b", "prompt": msg.content, "stream": False}
        ).json()
        wcf.send_text(resp["response"], msg.roomid or msg.sender)

Ollama HTTP API:主要エンドポイント

Ollamaはollama serve後にhttp://localhost:11434でローカルRESTサーバーを起動。ローカル接続に認証不要。

生成(シングルターン): POST /api/generate — ボディ:{model, prompt, stream: false}

チャット(マルチターン): POST /api/chat — ボディ:`{model, messages: [{role, content}]}`

ミニPCをWeChat LLMサーバーとして常時稼働

Minisforum UM890 Pro(推奨): AMD Ryzen 9 8945HS、32–64 GB DDR5。Qwen2.5 7Bで~8 tok/s。消費電力:~35 W。価格:約4.5〜6万円。

Mac Mini M4: Apple Silicon M4、16–32 GBユニファイドメモリ、~18 tok/s(MLX経由)。消費電力:~20 W。価格:約9万円〜。

自動起動: systemd(Linux)またはWindowsタスクスケジューラーでollama serveとWeChatFerryブリッジを自動起動。

中国語WeChat会話向け最適モデル

Qwen2.5 7B Q4_K_M(第1推奨): Alibabaがネイティブ中国語処理に特化して開発。5.5 GB VRAM、8–15 tok/s。インストール:ollama pull qwen2.5:7b

Qwen2.5 14B Q4_K_M: 12–16 GB RAM環境での充実した会話向け。

避けるべき: Llama 3とMistral——中国語テキストに2〜3倍多くのトークンを使用。

グループチャット対応

WeChatグループチャットでは@メンション処理が必要。WeChatFerryはmsg.is_atを公開。

ベストプラクティス:msg.is_atがTrueの時のみ返信。送信者別(msg.sender)で会話履歴を管理。

プライバシーと個人情報保護法対応

ローカル推論により、プロンプト・応答・会話履歴はハードウェア外に出ません。

個人情報保護法(APPI): ローカルLLMはクラウドプロバイダーとの個人情報処理委託契約を不要にします。

METIガイドライン: AI製品・サービスの安全・信頼性向上に関するガイドラインにおいて、オンプレミス推論は推奨されるアプローチです。

カバーされない点: WeChat メッセージのメタデータはTencent ToSによりTencent サーバーに保存されます。

よくある質問

WeChatFerryはWeChat for Macで動きますか?

いいえ。WeChatFerryはWindowsのWeChat PCクライアントDLLをフックするため、Mac版WeChat非対応です。

Tencentにアカウントがバンされますか?

人間的な返信レート(1〜5メッセージ/分)のパーソナルボットはほとんどバンされません。大量送信は避けてください。

中国語向け最適Ollamaモデルは?

Qwen2.5 7B Q4_K_M。Alibabaがネイティブ中国語処理向けに開発、5.5 GB VRAM。

ノートパソコンで使えますか?

はい。16 GBのRAMでQwen2.5 7BをCPU-onlyで8〜15 tok/sで実行可能。応答遅延3〜8秒。

個人情報保護法への対応は?

ローカルLLMはクラウドプロバイダーへのデータ転送を回避。WeChatメタデータはTencentサーバーに残ります。

マルチターン会話の管理方法は?

送信者別に{role, content}辞書のリストを保持し、最新10〜15メッセージを/api/chatに渡します。

← Power Local LLM に戻る

WeChat ローカルLLM統合 2026 | Ollama APIブリッジ | PromptQuorum