WeChatFerryはMacで動きますか？

いいえ、Windows版WeChat PCクライアントのみ対応です。

中国語テキスト向け最適モデルは？

Qwen3 7B Q4_K_M——5.5 GB VRAMのネイティブ中国語対応モデル。

ホーム/ローカルLLM活用/WeChat + ローカルLLM統合：開発者ガイド 2026

Local AI Agents & Tool Use

WeChat + ローカルLLM統合：開発者ガイド 2026

最終更新: 2026-05-26·11分で読める·Hans Kuepper 著 · PromptQuorumの創設者、マルチモデルAIディスパッチツール · PromptQuorum

言語を選択:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

WeChatをローカルLLMに接続するには、ミニPC上でOllamaを実行し、WeChatFerry（Windows版）でWeChat PCクライアントのメッセージをインターセプトし、PythonブリッジでOllama HTTP APIにルーティングします。中国語チャットにはQwen3 7B Q4_K_Mを推奨します。

WeChatをローカルLLMに接続することで、世界最大のメッセージングアプリでプライベートなAIアシスタントが利用可能になります。クラウドAPIへのデータ送信は一切不要です。このガイドでは3つの統合パターン、中国語テキスト向けモデル選択、個人情報保護法対応について解説します。

スライドデッキ: WeChat + ローカルLLM統合：開発者ガイド 2026

この記事のインタラクティブスライド。

以下のスライドを閲覧するか、PDFとしてダウンロードしてください。リファレンスカードをダウンロード（PDF）

重要なポイント

WeChatFerry（Windows）は2026年で最も信頼性の高いWeChat PCフック
OllamaはポートI11434でローカルHTTP APIを公開——10行のPythonでルーティング可能
Qwen3 7B Q4_K_M：中国語チャットに推奨——5.5 GB VRAM、ネイティブCJKトークン化
Always-onミニPCサーバー（Minisforum UM890 Pro、約35 W）——24/7稼働
ローカル推論：個人情報保護法対応——データは自分のデバイスから出ない

WeChat + LLM 3つの統合パターン

パターン1 — WeChatFerry + Ollama（Windows）： 最も安定。WeChatFerryがWeChat PCクライアントにフックし、Python SDKを公開。個人チャットとグループチャット両方に対応。

パターン2 — HTTPウェブフックブリッジ： クロスプラットフォーム対応だがセットアップが複雑。WeChat公式アカウントインフラを持つ企業向け。

パターン3 — Ollama + Open WebUI： 最もシンプルな一方向通知オプション。フック不要。

WeChatFerryセットアップ：ステップバイステップ

1
WeChat PC（weixin.qq.comの公式版）をWindowsにインストール
2
WeChatFerryをインストール：pip install wcferry（Python 3.10+）
3
WeChatFerryデーモン起動：python -m wcferry.daemon
4
メッセージハンドラーを作成し、localhost:11434へルーティング
5
返信送信：wcf.send_text(response, msg.roomid or msg.sender)

python

import requests
from wcferry import Wcf

wcf = Wcf()
wcf.enable_receiving_msg()

while True:
    msg = wcf.get_msg()
    if msg and msg.from_self() is False:
        resp = requests.post(
            "http://localhost:11434/api/generate",
            json={"model": "qwen2.5:7b", "prompt": msg.content, "stream": False}
        ).json()
        wcf.send_text(resp["response"], msg.roomid or msg.sender)

Ollama HTTP API：主要エンドポイント

Ollamaはollama serve後にhttp://localhost:11434でローカルRESTサーバーを起動。ローカル接続に認証不要。

生成（シングルターン）： POST /api/generate — ボディ：{model, prompt, stream: false}

チャット（マルチターン）： POST /api/chat — ボディ：`{model, messages: [{role, content}]}`

ミニPCをWeChat LLMサーバーとして常時稼働

Minisforum UM890 Pro（推奨）： AMD Ryzen 9 8945HS、32–64 GB DDR5。Qwen3 7Bで~8 tok/s。消費電力：~35 W。価格：約4.5〜6万円。

Mac Mini M4： Apple Silicon M4、16–32 GBユニファイドメモリ、~18 tok/s（MLX経由）。消費電力：~20 W。価格：約9万円〜。

自動起動： systemd（Linux）またはWindowsタスクスケジューラーでollama serveとWeChatFerryブリッジを自動起動。

中国語WeChat会話向け最適モデル

Qwen3 7B Q4_K_M（第1推奨）： Alibabaがネイティブ中国語処理に特化して開発。5.5 GB VRAM、8–15 tok/s。インストール：ollama pull qwen2.5:7b。

Qwen3 14B Q4_K_M： 12–16 GB RAM環境での充実した会話向け。

避けるべき： Llama 3とMistral——中国語テキストに2〜3倍多くのトークンを使用。

グループチャット対応

WeChatグループチャットでは@メンション処理が必要。WeChatFerryはmsg.is_atを公開。

ベストプラクティス：msg.is_atがTrueの時のみ返信。送信者別（msg.sender）で会話履歴を管理。

プライバシーと個人情報保護法対応

ローカル推論により、プロンプト・応答・会話履歴はハードウェア外に出ません。

個人情報保護法（APPI）： ローカルLLMはクラウドプロバイダーとの個人情報処理委託契約を不要にします。

METIガイドライン： AI製品・サービスの安全・信頼性向上に関するガイドラインにおいて、オンプレミス推論は推奨されるアプローチです。

カバーされない点： WeChat メッセージのメタデータはTencent ToSによりTencent サーバーに保存されます。

よくある質問

WeChatFerryはWeChat for Macで動きますか？

いいえ。WeChatFerryはWindowsのWeChat PCクライアントDLLをフックするため、Mac版WeChat非対応です。

Tencentにアカウントがバンされますか？

人間的な返信レート（1〜5メッセージ/分）のパーソナルボットはほとんどバンされません。大量送信は避けてください。

中国語向け最適Ollamaモデルは？

Qwen3 7B Q4_K_M。Alibabaがネイティブ中国語処理向けに開発、5.5 GB VRAM。

ノートパソコンで使えますか？

はい。16 GBのRAMでQwen3 7BをCPU-onlyで8〜15 tok/sで実行可能。応答遅延3〜8秒。

個人情報保護法への対応は？

ローカルLLMはクラウドプロバイダーへのデータ転送を回避。WeChatメタデータはTencentサーバーに残ります。

マルチターン会話の管理方法は？

送信者別に{role, content}辞書のリストを保持し、最新10〜15メッセージを/api/chatに渡します。

← ローカルLLM活用に戻る