重要なポイント
- Qwen3 8Bは最良の実用的な選択肢です。Ollama経由(`ollama run qwen3:8b`)で8GBのVRAMで動作し、優れたブラジルポルトガル語出力を生成します
- 16GB以上のVRAMがある場合、より高い品質を求めるならQwen3 14B / 32B(`ollama run qwen3:14b` / `ollama run qwen3:32b`)
- Llama 3.1 8Bはポルトガル語で競争力があり、Ollamaネイティブです(`ollama run llama3.1:8b`)
- Sabiá-3(Maritaca AI)はGPT-4oに近いポルトガル語品質に達しますが、Ollamaにはありません — HuggingFaceからのダウンロードが必要です
- PT-BR品質を自分でテストしましょう:PT-BRでプロンプトを入力し、você/tuの使用、語彙、文法を確認します
- PT向けの本番利用では、主に英語で学習されたモデルを避けてください
ブラジルポルトガル語でモデル選択が重要な理由
モデルの選択は、ブラジルポルトガル語の出力品質に過大な影響を与えます。主に英語データで学習されたモデルは、文法上の誤り、ヨーロッパポルトガル語の語彙(arquivoの代わりにficheiro、telaの代わりにecrã)、誤った代名詞の形(ブラジルポルトガル語の標準主語代名詞であるvocêの代わりにtu)を生成します。
PT-BR品質を決定する要因は3つあります。学習データ中のポルトガル語テキストの量、ポルトガル語の語彙に対するトークン化の効率、そしてモデルがポルトガル語の指示でファインチューニングされたかどうかです。ポルトガル語の学習データが5%未満のモデルは、通常、ぎこちなく翻訳のように聞こえる出力を生成します。
Qwen3は119言語にわたる約36兆トークンで学習されており、強力な多言語カバレッジを備えています。Maritaca AIのSabiá-3はポルトガル語専用に設計されており、ポルトガル語タスクでGPT-4oに近い性能を達成します。
📍 一文で説明
ブラジルポルトガル語には、ヨーロッパポルトガル語の語彙や誤った代名詞の形を避けるため、文書化された多言語学習データを持つモデル(Qwen3、Llama 3.1、またはSabiá-3)を選んでください。
💬 簡潔に説明
ポルトガル語には主に2つの変種があります。ブラジルポルトガル語(PT-BR)とヨーロッパポルトガル語(PT-PT)です。これらは語彙、文法、代名詞の使い方が異なります。「Você」はブラジルで標準的で、「tu」はポルトガルでより一般的です。「Arquivo」(ファイル)と「tela」(画面)はブラジル語で、「ficheiro」と「ecrã」はヨーロッパ語です。既定でヨーロッパポルトガル語を使うモデルは、ブラジルのユーザーにとって不自然に感じられ、業務文書で誤りを引き起こす可能性があります。
ブラジルポルトガル語向けの最良のローカルLLM 2026
以下のモデルは、ブラジルポルトガル語の出力品質、VRAM効率、インストールの容易さの組み合わせでランク付けされています。Ollama対応のすべてのモデルは、単一のコマンドでダウンロードして実行できます。
| モデル | サイズ | VRAM (Q4) | PT-BR品質 | Ollama対応? | 最適な用途 |
|---|---|---|---|---|---|
| Qwen3 8B | 8B | ~7 GB | 非常に良い | はい (ollama run qwen3:8b) | 最良のオールラウンドなローカルPT選択肢 |
| Qwen3 14B | 14B | ~9 GB | 優秀 | はい (ollama run qwen3:14b) | より高い品質、より多くのニュアンス |
| Qwen3 32B | 32B | ~20 GB | 優秀+ | はい (ollama run qwen3:32b) | 24GBのVRAMがあれば最高品質 |
| Llama 3.1 8B | 8B | ~7 GB | 良い | はい (ollama run llama3.1:8b) | 一般的なPT、競争力あり |
| Gemma 3 27B | 27B | ~18 GB | 良い | はい (ollama run gemma3:27b) | 幅広い言語サポート(35以上の言語) |
| Sabiá-3 | ~7B | ~7 GB | GPT-4oに近い | いいえ(HuggingFaceのみ) | 最高のPT品質、実行はより難しい |
Sabiá-3はOllamaでは利用できません。HuggingFace(https://huggingface.co/maritaca-ai)からダウンロードし、llama.cppまたはLM Studioで実行する必要があります。他のすべてのモデルは、単一のollama pullコマンドでインストールできます。
ブラジルポルトガル語ユーザー向けVRAMガイド
利用可能なVRAMによって、実行できるモデルが決まります。すべての推奨事項は、Ollamaまたはllama.cpp経由のQ4_K_M量子化を前提としています。
- 8GBのVRAM / 16GBのRAM: Qwen3 8B(~7GB)、Llama 3.1 8B(~7GB)、Sabiá-3(GGUFダウンロードを伴うllama.cpp経由で~7GB)
- 12GBのVRAM: すべての8Bモデルを余裕をもって;Q4_K_MでQwen3 14B(~9GB)
- 16GBのVRAM: 余裕をもってQwen3 14B;Gemma 3 12B
- 24GBのVRAM: Qwen3 32B(~20GB)、Gemma 3 27B(~18GB)
- CPUのみ(16GBのRAM): Ollama経由で約2〜4トークン/秒のQwen3 8B;バッチタスクには使用可能、対話型チャットには遅い
Sabiá-3の実行方法(Ollamaにはありません)
Sabiá-3は、ポルトガル語の言語モデルを専門とするブラジル企業Maritaca AIによって開発されています。ポルトガル語タスクでGPT-4oに近い性能を達成し、ブラジルポルトガル語向けで最も強力なオープンウェイトモデルです。
Sabiá-3はOllamaのモデルライブラリでは利用できません。ローカルで実行するには、Maritaca AIのHuggingFaceページ(https://huggingface.co/maritaca-ai)からGGUFファイルをダウンロードし、llama.cppまたはLM Studioで実行します。LM Studioは、組み込みの検索インターフェースでHuggingFaceからGGUFを直接読み込むことをサポートしています — LM Studioのモデルブラウザーで「maritaca」を検索してください。
第1世代のSabiá(Sabiá-7BおよびSabiá-65B)はLlamaアーキテクチャに基づいていました。Sabiá-3は、強力なベースモデル上でポルトガル語に焦点を当てたファインチューニングというこの伝統を引き継いでいます。
- ダウンロードパス:https://huggingface.co/maritaca-ai
- 実行方法:llama.cpp(CLI)またはLM Studio(GUI、初心者に推奨)
- VRAM要件:Q4量子化で約7GB
- 注:`ollama run sabia`コマンドは存在しません — SabiáはOllamaライブラリにはありません
ブラジルポルトガル語の品質をテストする方法
英語のベンチマークに相当する単一の標準化されたブラジルポルトガル語ベンチマークは存在しません。PoETa v2はポルトガル語の評価ベンチマークですが、最も信頼できる品質チェックは、実際のPT-BRタスクを用いた実践的なテストです。
PT-BR出力が不十分な兆候:主語代名詞として「tu」を使用する(ヨーロッパポルトガル語の慣習)、「arquivo」の代わりに「ficheiro」を使用する、「tela」の代わりに「ecrã」を使用する、英語からの翻訳のように読めるぎこちない言い回し、誤った動詞の活用。
- ビジネスメールテスト: モデルに「português formal do Brasil」で正式なビジネスメールを書くよう依頼します — você形、「Prezado/a」、ブラジルのビジネス語彙を確認します
- 語彙チェック: 「Como se chama um arquivo de computador em português do Brasil?」と尋ねます — 良いモデルは「arquivo」と答えます;調整が不十分なモデルは「ficheiro」と答えることがあります
- 代名詞の形: 「Como você está?」でプロンプトを入力します — 後続の応答が一貫して「tu」ではなく「você」を使用しているか確認します
- 法律的/正式な語調: PT-BRで短い契約条項を依頼します — 正しい接続法の形とブラジルの法律語彙を確認します
- 地域的な認識: 「Qual é a diferença entre português do Brasil e português de Portugal?」と尋ねます — モデルは正確で確信のある区別を示すべきです
よくある質問
2026年のブラジルポルトガル語向けで最良のローカルLLMは何ですか?
Qwen3 8Bが最良の実用的な選択肢です。Ollama経由で8GBのVRAMで動作し、119言語にわたる36兆トークンで学習されています。最高のPT-BR品質を求めるなら、Maritaca AIのSabiá-3がGPT-4oの性能に近づきますが、HuggingFaceからのダウンロードが必要です。
標準的なノートパソコンでローカルLLMを実行できますか?
はい。16GBのRAMを搭載したほとんどの最新ノートパソコンは、CPUのみでOllama経由でQwen3 8Bを2〜4トークン/秒で実行できます。専用GPU(8GBのVRAM)があれば、速度は15〜20トークン/秒に上がります。
Sabiáとは何ですか、どこでダウンロードできますか?
Sabiá-3は、ブラジル企業Maritaca AIによるポルトガル語特化モデルです。https://huggingface.co/maritaca-ai からGGUFファイルをダウンロードし、llama.cppまたはLM Studioで実行してください。Ollamaライブラリでは利用できません。
Qwen3はブラジルポルトガル語をヨーロッパポルトガル語と異なる形で理解しますか?
Qwen3は両方の変種を扱います。PT-BR(「você」とブラジルの語彙を使用)でプロンプトを入力すると、PT-BRで応答します。最良の結果を得るには、希望する変種を明示的に指定してください。
Llama 3.1はポルトガル語に適していますか?
はい、Llama 3.1 8Bは2026年のポルトガル語向けローカルモデルのトップ3に入ります。Ollama経由で利用でき、一般的な用途に適した良いPT-BR出力を生成します。
ブラジルポルトガル語の用途でOllamaをインストールするにはどうすればよいですか?
ollama.comからOllamaをインストールし(すべての言語で同じ手順)、次に実行します:ollama run qwen3:8b。Ollamaの完全なインストールガイドは /ja/local-llms/how-to-install-ollama をご覧ください。
ローカルLLMの使用はLGPDコンプライアンスに役立ちますか?
はい。LLMをローカルで実行するということは、データが自分のインフラ上に留まり、サードパーティのクラウドプロバイダーに送信されないことを意味し、LGPDコンプライアンスを簡素化します。詳細は関連するLGPD記事をご覧ください。
ポルトガル語のLLMをテストするベンチマークは何ですか?
PoETa v2はポルトガル語の評価ベンチマークです。実用上は、英語のベンチマークに相当する単一の標準化されたブラジルポルトガル語ベンチマークが存在しないため、実際のPT-BRタスクを用いた手動テストが最も信頼できる品質チェックです。
Qwen3は正式なブラジルポルトガル語のビジネス文書を扱えますか?
はい。「escreva em português formal do Brasil」または「português brasileiro formal」でプロンプトを入力すると、一貫して正式なvocê形のビジネス出力が得られます。
Tucanoとは何ですか?
Tucanoは、C4AI-USP(サンパウロ大学)によるオープンウェイトのポルトガル語言語モデルです。ポルトガル語専用に設計されており、リソースが限られた環境で効率的です。HuggingFaceで利用できます。
関連記事
- ローカルLLMによるLGPDコンプライアンス(ブラジル2026) — ローカルLLMがLGPDデータコンプライアンスをどのように簡素化するか
- ブラジルポルトガル語向けの最良のローカルLLM — Versão em Português
- 多言語ローカルLLM — 複数の言語でLLMを実行するためのガイド
- ローカルLLMとは?
- Ollamaのインストール方法
- 最良のローカルLLM 2026
- LGPDコンプライアンス — ポルトガル語版
出典
- SiliconFlow (2026). "Best Open-Source LLM for Portuguese Language Tasks." — Qwen3とLlama 3.1 8Bを含むポルトガル語向けトップ3モデル
- Maritaca AI. "Sabiá-3 Model Card." HuggingFace — https://huggingface.co/maritaca-ai
- Qwen Team (2024). "Qwen Technical Report." arXiv — Qwen3の学習データ:36兆トークン、119言語
- PoETa v2 benchmark — LLM向けポルトガル語評価ツールキット
- C4AI-USP. "Tucano: Open-weight Portuguese LLM." HuggingFace