重要なポイント
- 家庭制御は最大のモデルサイズではなく、低レイテンシと信頼できる関数呼び出しを報いる
- 4B モデルは低消費電力ハードウェアに、8B モデルは GPU または NPU 付きのミニPCに適する
- Gemma 3 4B(Google)、Qwen3 4B(Alibaba)、Qwen3 8B(Alibaba)は一般的で、よく支援された選択肢
- Qwen3、Gemma 3、Phi-4-mini は今日、実証済みの Home Assistant ツール呼び出し対応を備える
- あなたが話しかける言語を強く支援するモデルを選ぶ
- 深いモデルのランキングと仕組みは local-llms クラスターへ外部リンク
家庭制御で重要なこと
良い家庭制御モデルを決めるのは三つ:レイテンシ、信頼できる関数呼び出し、そしてハードウェアに合うサイズです。 ベンチマークの順位表は、ここでは応答性ほど重要ではありません。
- レイテンシ: 音声命令はほぼ即時に感じられるべき;高性能なハードウェア上の小型モデルほど速く応答します。
- 関数呼び出し: モデルは構造化された機器の動作を確実に出力する必要がある——これが決定的な能力です。
- 適合: モデルは、Home Assistant もホストする機器で快適に動かなければなりません——ローカルスマートホームに最適なハードウェアを参照。
短いリスト
これらの小型モデルは、さまざまなハードウェア予算にわたる家庭制御で一般的かつよく支援された選択肢です。 軽いハードウェアでは 4B モデルを、GPU または NPU があるときは 8B モデルを使います。Gemma 4(2026年6月)は最新の選択肢で、Qwen3、Gemma 3、Phi-4-mini は今日、実証済みの Home Assistant ツール呼び出し対応を備えます。
- Gemma 3 4B(Google): 40 億パラメータのモデルで、広い多言語対応(140 以上の言語)を持つ、強力な低消費電力の選択肢——Ollama タグ
gemma3:4b。 - Qwen3 4B(Alibaba): 信頼できるツール利用と良好な多言語対応を備えた高速な 4B モデルで、CPU や統合 GPU で低レイテンシ——
qwen3:4b。 - Phi-4-mini(Microsoft): 指示追従でサイズ以上に活躍するコンパクトな 3.8B モデル——
phi4-mini。 - Llama 3.2 3B(Meta): 控えめなハードウェアで良好な関数呼び出しで動く、広く支援された 3B のベースライン——
llama3.2:3b。 - Qwen3 8B(Alibaba): ここでは GPU または NPU で最高品質、ツール呼び出しでの Home Assistant のお気に入り——
qwen3:8b。
比較
ハードウェアと言語で選びましょう:CPU のみや Pi クラスのハードウェアにはより小型を、GPU 付きミニPCには 8B を。 以下のサイズは一般的な 4 ビット量子化での概算です;Ollama タグが取得する正確なモデルです。
- サイズは概算で、量子化に依存します——VRAM と量子化の詳細は local-llms クラスターへ外部リンク。
| モデル | パラメータ | 概算サイズ (Q4) | Ollama タグ | 最適な用途 |
|---|---|---|---|---|
| Gemma 3 4B | 4B | 約 3 GB | gemma3:4b | 低消費電力ホスト、140以上の言語 |
| Qwen3 4B | 4B | 約 2.5〜3 GB | qwen3:4b | 低レイテンシ、多言語、ツール |
| Phi-4-mini | 3.8B | 約 2.5〜3 GB | phi4-mini | 強い指示追従 |
| Llama 3.2 3B | 3B | 約 2〜3 GB | llama3.2:3b | 広く支援されたベースライン |
| Qwen3 8B | 8B | 約 5 GB | qwen3:8b | GPU/NPU で最高品質;HA のお気に入り |
ハードウェア予算別の候補
Pi や CPU のみのミニPCには 4B モデルを、GPU または NPU があるときは 8B モデルを選びましょう。 これで各ティアで応答をキビキビ保てます。
- Raspberry Pi / 低消費電力: Gemma 3 4B または Qwen3 4B、より遅い応答を許容して。
- ミニPC(CPU のみ): 反応の良い既定として Qwen3 4B または Phi-4-mini。
- GPU/NPU 付きミニPC: 許容できるレイテンシで最高品質なら Qwen3 8B——Home Assistant+ローカルAIに最適なミニPCを参照。
選び方
4B モデルから始め、レイテンシと信頼できる機器の動作を確認し、品質が足りない場合のみ 8B へ移りましょう。 決める前に、実際の命令でテストします。
- Ollama 統合経由でインストールし、よく使う命令をテストします。
- 応答が遅ければ、一段下げるか GPU/NPU を追加します。
- 動作が不安定なら、関数呼び出しで知られるモデルを優先します。
- 深いモデルのランキングと仕組みは最適なローカルLLM 2026(クラスター横断)を参照——本ガイドは家庭制御に特化したままです。
よくある質問
家庭制御に使える最小のモデルは?
Llama 3.2 3B のような 3B モデルは、低消費電力ハードウェアでの信頼できる機器制御の実用的な下限で、理解の一部を速度と引き換えにします。ハードウェアが許せば、Gemma 3 4B や Qwen3 4B のような 4B モデルがより良いバランスです。
家庭制御モデルに GPU は必要ですか?
CPU や統合 GPU で動く 4B モデルには不要です。GPU や NPU は主に、より良い理解のために Qwen3 8B のような 8B モデルを低レイテンシで動かせるようにします。モデルをハードウェアに合わせましょう。
どのモデルが関数呼び出しに対応していますか?
Qwen3、Gemma 3、Phi-4-mini を含む現代の小型モデルは、実証済みの Home Assistant ツール/関数呼び出し対応を備え、これが信頼できる機器の動作を出力させる能力です。家庭制御には、対応が文書化されたモデルを優先しましょう。
Raspberry Pi に最適なモデルは?
Gemma 3 4B や Qwen3 4B のような 4B モデルが Raspberry Pi での実用的な上限で、応答はミニPCより遅くなります。キビキビしたアシスタントには、Qwen3 8B を動かす GPU/NPU 付きのミニPCがより良いホストです。