クイック回答
はい — Ollama は Qwen 3 の全モデルサイズ(0.6B〜72B)に対応しています。ollama run qwen3:8b で任意のサイズを実行できます。8B モデルは Q4 で ~6 GB VRAM が必要です。
更新: 2026-05
重要なポイント
2026年5月時点で、Ollama は Qwen 3 の全主要モデルサイズ(0.6B〜72B)をサポートしています。 単一コマンドで任意のサイズをダウンロードできます:ollama run qwen3:8b。他のサイズには 8b を 0.6b、1.5b、3b、14b、32b、または 72b に置き換えてください。
各サイズは複数の量子化形式で利用可能です。Q4_K_M がデフォルトで推奨の出発点です — 品質とファイルサイズの最良のバランスを提供します。VRAM に余裕がある場合、7B と 14B では Q8_0 も利用できます。
ツール呼び出しは標準 Ollama API を通じて全 Qwen 3 サイズでネイティブにサポートされています。カスタム Modelfile や特別なプロンプトテンプレートは必要ありません。
ollama run qwen3:8b最適な Qwen 3 のサイズは利用可能な VRAM によって完全に決まります。ミドルレンジ GPU(6〜8 GB VRAM)を持つほとんどのユーザーには、Q4_K_M の 7B モデルが実用的な選択です — ~6 GB が必要で ~20 tok/s で動作します。
Q4 の 14B モデルはコーディング向けの推奨ティアです:コード生成において 7B を上回り、10〜12 GB VRAM に快適に収まります。Qwen 3 のコーディング性能と他のローカルモデルの完全な比較については、2026年版 Qwen をローカルで実行するガイドをご覧ください。
| VRAM | Qwen 3 サイズ | 用途 |
|---|---|---|
| < 4 GB | 0.6B / 1.5B | エッジデバイス、テスト、CPU 専用 |
| 4–6 GB | 3B | バジェット GPU または低 RAM CPU |
| 6–12 GB | 7B / 14B | 汎用およびコーディング |
| 12–24 GB | 14B / 32B | 高品質コーディングと推論 |
| 40+ GB | 72B | フロンティアに近いローカル品質 |
ollama run qwen3:8b を実行してください。Ollama は初回起動時に自動的にモデルをダウンロードします。8b を目的のサイズに置き換えてください:0.6b、1.5b、3b、14b、32b、または 72b。