PromptQuorumPromptQuorum

Qwen 3 は Ollama で動かせますか?

クイック回答

はい — Ollama は Qwen 3 の全モデルサイズ(0.6B〜72B)に対応しています。ollama run qwen3:8b で任意のサイズを実行できます。8B モデルは Q4 で ~6 GB VRAM が必要です。

  • ollama run qwen3:0.6b — 1 GB VRAM に収まります
  • ollama run qwen3:8b — ~6 GB VRAM が必要
  • ollama run qwen3:72b — ~40 GB VRAM が必要

更新: 2026-05

Ollama

重要なポイント

  • Ollama は Qwen 3 の全サイズ(0.6B、1.5B、3B、7B、14B、32B、72B)をサポートしています
  • <code>ollama run qwen3:8b</code> で任意のサイズを取得できます — タグを目的のサイズに置き換えてください
  • 7B モデルは Q4 で ~6 GB VRAM が必要で、ミドルレンジ GPU で ~20 tok/s で動作します
  • Qwen 3 は標準 Ollama API 経由でネイティブにツール呼び出しをサポートしています — カスタム Modelfile は不要です

はい — 利用可能な内容

2026年5月時点で、Ollama は Qwen 3 の全主要モデルサイズ(0.6B〜72B)をサポートしています。 単一コマンドで任意のサイズをダウンロードできます:ollama run qwen3:8b。他のサイズには 8b0.6b1.5b3b14b32b、または 72b に置き換えてください。

各サイズは複数の量子化形式で利用可能です。Q4_K_M がデフォルトで推奨の出発点です — 品質とファイルサイズの最良のバランスを提供します。VRAM に余裕がある場合、7B と 14B では Q8_0 も利用できます。

ツール呼び出しは標準 Ollama API を通じて全 Qwen 3 サイズでネイティブにサポートされています。カスタム Modelfile や特別なプロンプトテンプレートは必要ありません。

ollama run qwen3:8b

Qwen 3 のサイズ選択

最適な Qwen 3 のサイズは利用可能な VRAM によって完全に決まります。ミドルレンジ GPU(6〜8 GB VRAM)を持つほとんどのユーザーには、Q4_K_M の 7B モデルが実用的な選択です — ~6 GB が必要で ~20 tok/s で動作します。

Q4 の 14B モデルはコーディング向けの推奨ティアです:コード生成において 7B を上回り、10〜12 GB VRAM に快適に収まります。Qwen 3 のコーディング性能と他のローカルモデルの完全な比較については、2026年版 Qwen をローカルで実行するガイドをご覧ください。

VRAMQwen 3 サイズ用途
< 4 GB0.6B / 1.5Bエッジデバイス、テスト、CPU 専用
4–6 GB3Bバジェット GPU または低 RAM CPU
6–12 GB7B / 14B汎用およびコーディング
12–24 GB14B / 32B高品質コーディングと推論
40+ GB72Bフロンティアに近いローカル品質

Ollama 上の Qwen 3 に関するよくある質問

Ollama に Qwen 3 をインストールするには?
ターミナルで ollama run qwen3:8b を実行してください。Ollama は初回起動時に自動的にモデルをダウンロードします。8b を目的のサイズに置き換えてください:0.6b、1.5b、3b、14b、32b、または 72b。
Qwen 3 はコーディングで Llama 3 より優れていますか?
コーディングに関しては:はい、Qwen 3 14B は HumanEval ベンチマークで Llama 3 8B を上回ります。8B ティアでの一般的な会話では、Llama 3 8B は競争力を維持しています。全タスクの現在のトップ Ollama 推奨については、現在の最適 Ollama モデルをご覧ください。
Qwen 3 は Ollama でツール呼び出しをサポートしていますか?
はい。Qwen 3 は標準 Ollama API 経由でファンクション呼び出しとツール呼び出しをネイティブにサポートしています。カスタム Modelfile や特別な設定は不要です — Ollama のツール使用形式をサポートする任意のクライアントで動作します。
Qwen 3 72B はコンシューマーハードウェアで動かせますか?
技術的には可能ですが、Q4 で ~40 GB VRAM が必要です — つまりデュアル GPU 構成(RTX 3090 2枚)または 64GB 以上のユニファイドメモリを持つ Apple M-series Mac が必要です。ほとんどのコンシューマー環境では 32B ティアが上限となります。