重要なポイント
- WeChatFerry(Windows)は2026年で最も信頼性の高いWeChat PCフック
- OllamaはポートI11434でローカルHTTP APIを公開——10行のPythonでルーティング可能
- Qwen2.5 7B Q4_K_M:中国語チャットに推奨——5.5 GB VRAM、ネイティブCJKトークン化
- Always-onミニPCサーバー(Minisforum UM890 Pro、約35 W)——24/7稼働
- ローカル推論:個人情報保護法対応——データは自分のデバイスから出ない
WeChat + LLM 3つの統合パターン
パターン1 — WeChatFerry + Ollama(Windows): 最も安定。WeChatFerryがWeChat PCクライアントにフックし、Python SDKを公開。個人チャットとグループチャット両方に対応。
パターン2 — HTTPウェブフックブリッジ: クロスプラットフォーム対応だがセットアップが複雑。WeChat公式アカウントインフラを持つ企業向け。
パターン3 — Ollama + Open WebUI: 最もシンプルな一方向通知オプション。フック不要。
WeChatFerryセットアップ:ステップバイステップ
- 1WeChat PC(weixin.qq.comの公式版)をWindowsにインストール
- 2WeChatFerryをインストール:
pip install wcferry(Python 3.10+) - 3WeChatFerryデーモン起動:
python -m wcferry.daemon - 4メッセージハンドラーを作成し、localhost:11434へルーティング
- 5返信送信:
wcf.send_text(response, msg.roomid or msg.sender)
import requests
from wcferry import Wcf
wcf = Wcf()
wcf.enable_receiving_msg()
while True:
msg = wcf.get_msg()
if msg and msg.from_self() is False:
resp = requests.post(
"http://localhost:11434/api/generate",
json={"model": "qwen2.5:7b", "prompt": msg.content, "stream": False}
).json()
wcf.send_text(resp["response"], msg.roomid or msg.sender)Ollama HTTP API:主要エンドポイント
Ollamaはollama serve後にhttp://localhost:11434でローカルRESTサーバーを起動。ローカル接続に認証不要。
生成(シングルターン): POST /api/generate — ボディ:{model, prompt, stream: false}
チャット(マルチターン): POST /api/chat — ボディ:`{model, messages: [{role, content}]}`
ミニPCをWeChat LLMサーバーとして常時稼働
Minisforum UM890 Pro(推奨): AMD Ryzen 9 8945HS、32–64 GB DDR5。Qwen2.5 7Bで~8 tok/s。消費電力:~35 W。価格:約4.5〜6万円。
Mac Mini M4: Apple Silicon M4、16–32 GBユニファイドメモリ、~18 tok/s(MLX経由)。消費電力:~20 W。価格:約9万円〜。
自動起動: systemd(Linux)またはWindowsタスクスケジューラーでollama serveとWeChatFerryブリッジを自動起動。
中国語WeChat会話向け最適モデル
Qwen2.5 7B Q4_K_M(第1推奨): Alibabaがネイティブ中国語処理に特化して開発。5.5 GB VRAM、8–15 tok/s。インストール:ollama pull qwen2.5:7b。
Qwen2.5 14B Q4_K_M: 12–16 GB RAM環境での充実した会話向け。
避けるべき: Llama 3とMistral——中国語テキストに2〜3倍多くのトークンを使用。
グループチャット対応
WeChatグループチャットでは@メンション処理が必要。WeChatFerryはmsg.is_atを公開。
ベストプラクティス:msg.is_atがTrueの時のみ返信。送信者別(msg.sender)で会話履歴を管理。
プライバシーと個人情報保護法対応
ローカル推論により、プロンプト・応答・会話履歴はハードウェア外に出ません。
個人情報保護法(APPI): ローカルLLMはクラウドプロバイダーとの個人情報処理委託契約を不要にします。
METIガイドライン: AI製品・サービスの安全・信頼性向上に関するガイドラインにおいて、オンプレミス推論は推奨されるアプローチです。
カバーされない点: WeChat メッセージのメタデータはTencent ToSによりTencent サーバーに保存されます。
よくある質問
WeChatFerryはWeChat for Macで動きますか?
いいえ。WeChatFerryはWindowsのWeChat PCクライアントDLLをフックするため、Mac版WeChat非対応です。
Tencentにアカウントがバンされますか?
人間的な返信レート(1〜5メッセージ/分)のパーソナルボットはほとんどバンされません。大量送信は避けてください。
中国語向け最適Ollamaモデルは?
Qwen2.5 7B Q4_K_M。Alibabaがネイティブ中国語処理向けに開発、5.5 GB VRAM。
ノートパソコンで使えますか?
はい。16 GBのRAMでQwen2.5 7BをCPU-onlyで8〜15 tok/sで実行可能。応答遅延3〜8秒。
個人情報保護法への対応は?
ローカルLLMはクラウドプロバイダーへのデータ転送を回避。WeChatメタデータはTencentサーバーに残ります。
マルチターン会話の管理方法は?
送信者別に{role, content}辞書のリストを保持し、最新10〜15メッセージを/api/chatに渡します。