Skip to main content
PromptQuorumPromptQuorum
主页/本地LLM/巴西葡萄牙语最佳本地 LLM(2026)
Best Models

巴西葡萄牙语最佳本地 LLM(2026)

·阅读约8分钟·Hans Kuepper 作者 · PromptQuorum创始人,多模型AI调度工具 · PromptQuorum

Qwen3 8B 是 2026 年巴西葡萄牙语的最佳本地 LLM:8GB 显存,Ollama 原生支持,正确的 PT-BR 语法和词汇。若追求最高质量,Sabiá-3(Maritaca AI)在葡萄牙语上接近 GPT-4o,但需要从 HuggingFace 下载。Llama 3.1 8B 是有竞争力的第三选择,同样在 Ollama 上。

Qwen3 8B 是 2026 年巴西葡萄牙语的最佳本地 LLM:通过 Ollama 在 8GB 显存上运行,基于 119 种语言的 36 万亿个 token 训练,可生成准确的 PT-BR 输出,包括正确的 você 形式和巴西词汇。 Maritaca AI 的 Sabiá-3 在葡萄牙语上达到接近 GPT-4o 的质量,但需要从 HuggingFace 下载(不在 Ollama 上)。Llama 3.1 8B 位列前三。本指南涵盖最佳模型、显存要求、如何测试 PT-BR 质量以及如何在本地运行 Sabiá。

关键要点

  • Qwen3 8B 是最佳实用选择:通过 Ollama(`ollama run qwen3:8b`)在 8GB 显存上运行,巴西葡萄牙语输出强劲
  • 若你拥有 16GB 以上显存,可选 Qwen3 14B / 32B 以获得更高质量(`ollama run qwen3:14b` / `ollama run qwen3:32b`)
  • Llama 3.1 8B 在葡萄牙语上有竞争力且 Ollama 原生支持(`ollama run llama3.1:8b`)
  • Sabiá-3(Maritaca AI)在葡萄牙语上达到接近 GPT-4o 的质量,但不在 Ollama 上——需要从 HuggingFace 下载
  • 自行测试 PT-BR 质量:用 PT-BR 编写提示词,检查 você/tu 的用法、词汇和语法
  • 在面向 PT 的生产用途中,避免主要基于英语训练的模型

为什么模型选择对巴西葡萄牙语很重要

模型选择对巴西葡萄牙语的输出质量有着过大的影响。主要基于英语数据训练的模型会产生语法错误、欧洲葡萄牙语词汇(用 ficheiro 代替 arquivo,用 ecrã 代替 tela)以及错误的代词形式(用 tu 代替 você 作为巴西葡萄牙语的标准主语代词)。

三个因素决定 PT-BR 质量:训练数据中葡萄牙语文本的数量、针对葡萄牙语词汇的分词效率,以及模型是否在葡萄牙语指令上进行了微调。葡萄牙语训练数据少于 5% 的模型通常会产生生硬、像翻译一样的输出。

Qwen3 基于 119 种语言的约 36 万亿个 token 训练,使其具备强大的多语言覆盖。Maritaca AI 的 Sabiá-3 专为葡萄牙语打造,在葡萄牙语任务上达到接近 GPT-4o 的性能。

📍 简单一句话

对于巴西葡萄牙语,请选择训练数据有据可查的多语言模型——Qwen3、Llama 3.1 或 Sabiá-3——以避免欧洲葡萄牙语词汇和错误的代词形式。

💬 简单来说

葡萄牙语有两个主要变体:巴西葡萄牙语(PT-BR)和欧洲葡萄牙语(PT-PT)。它们在词汇、语法和代词用法上有所不同。「Você」在巴西是标准用法;「tu」在葡萄牙更常见。「Arquivo」(文件)和「tela」(屏幕)是巴西用法;「ficheiro」和「ecrã」是欧洲用法。默认使用欧洲葡萄牙语的模型对巴西用户来说显得不自然,并可能在专业文档中造成错误。

巴西葡萄牙语最佳本地 LLM 2026

以下模型按巴西葡萄牙语输出质量、显存效率和安装便捷性的综合情况排名。所有兼容 Ollama 的模型都可通过单个命令下载并运行。

模型大小VRAM (Q4)PT-BR 质量是否在 Ollama 上?最适合
Qwen3 8B8B~7 GB非常好是 (ollama run qwen3:8b)最佳全能本地 PT 选择
Qwen3 14B14B~9 GB优秀是 (ollama run qwen3:14b)更高质量,更多细腻之处
Qwen3 32B32B~20 GB优秀+是 (ollama run qwen3:32b)若有 24GB 显存则质量最佳
Llama 3.1 8B8B~7 GB良好是 (ollama run llama3.1:8b)通用 PT,有竞争力
Gemma 3 27B27B~18 GB良好是 (ollama run gemma3:27b)广泛的语言支持(35 种以上语言)
Sabiá-3~7B~7 GB接近 GPT-4o否(仅 HuggingFace)最佳 PT 质量,运行更难

Sabiá-3 不在 Ollama 上提供。必须从 HuggingFace(https://huggingface.co/maritaca-ai)下载,并使用 llama.cpp 或 LM Studio 运行。所有其他模型都可通过单个 ollama pull 命令安装。

巴西葡萄牙语用户的显存指南

你的可用显存决定了你能运行哪些模型。所有建议均假设通过 Ollama 或 llama.cpp 进行 Q4_K_M 量化。

  • 8GB 显存 / 16GB 内存: Qwen3 8B(~7GB)、Llama 3.1 8B(~7GB)、Sabiá-3(通过 llama.cpp 加 GGUF 下载,~7GB)
  • 12GB 显存: 轻松运行所有 8B 模型;Q4_K_M 下的 Qwen3 14B(~9GB)
  • 16GB 显存: Qwen3 14B 有余量;Gemma 3 12B
  • 24GB 显存: Qwen3 32B(~20GB)、Gemma 3 27B(~18GB)
  • 仅 CPU(16GB 内存): 通过 Ollama 运行 Qwen3 8B,约 2–4 token/秒;可用于批处理任务,交互式聊天较慢

如何运行 Sabiá-3(不在 Ollama 上)

Sabiá-3 由专注于葡萄牙语语言模型的巴西公司 Maritaca AI 开发。它在葡萄牙语任务上达到接近 GPT-4o 的性能,是巴西葡萄牙语最强的开放权重模型。

Sabiá-3 不在 Ollama 模型库中提供。要在本地运行它,请从 Maritaca AI 的 HuggingFace 页面 https://huggingface.co/maritaca-ai 下载 GGUF 文件,并使用 llama.cpp 或 LM Studio 运行。LM Studio 支持通过内置搜索界面直接从 HuggingFace 加载 GGUF——在 LM Studio 的模型浏览器中搜索「maritaca」。

第一代 Sabiá(Sabiá-7B 和 Sabiá-65B)基于 Llama 架构。Sabiá-3 延续了在强大基础模型上进行葡萄牙语专注微调的这一传统。

  • 下载路径:https://huggingface.co/maritaca-ai
  • 运行方式:llama.cpp(CLI)或 LM Studio(GUI,推荐初学者使用)
  • 显存要求:Q4 量化下约 7GB
  • 注意:不存在 `ollama run sabia` 命令——Sabiá 不在 Ollama 库中

如何测试巴西葡萄牙语质量

没有与英语基准等同的单一标准化巴西葡萄牙语基准。PoETa v2 是一个葡萄牙语评估基准,但最可靠的质量检查是用真实的 PT-BR 任务进行实际测试。

PT-BR 输出不佳的迹象:使用「tu」作为主语代词(欧洲葡萄牙语惯例)、使用「ficheiro」代替「arquivo」、使用「ecrã」代替「tela」、读起来像英语翻译的生硬措辞、错误的动词变位。

  • 商务邮件测试: 让模型用「português formal do Brasil」写一封正式商务邮件——检查 você 形式、「Prezado/a」、巴西商务词汇
  • 词汇检查: 询问「Como se chama um arquivo de computador em português do Brasil?」——好的模型回答「arquivo」;调校不佳的模型可能回答「ficheiro」
  • 代词形式: 用「Como você está?」编写提示词——检查后续回复是否一致使用「você」而非「tu」
  • 法律/正式语域: 用 PT-BR 请求一条简短的合同条款——检查正确的虚拟式形式和巴西法律词汇
  • 地区意识: 询问「Qual é a diferença entre português do Brasil e português de Portugal?」——模型应给出准确、自信的区分

常见问题

2026 年巴西葡萄牙语最佳本地 LLM 是哪个?

Qwen3 8B 是最佳实用选择:通过 Ollama 在 8GB 显存上运行,基于 119 种语言的 36 万亿个 token 训练。若追求最高 PT-BR 质量,Maritaca AI 的 Sabiá-3 接近 GPT-4o 性能,但需要从 HuggingFace 下载。

我能在标准笔记本电脑上运行本地 LLM 吗?

可以。大多数配备 16GB 内存的现代笔记本电脑可以仅用 CPU 通过 Ollama 以 2–4 token/秒运行 Qwen3 8B。配备独立 GPU(8GB 显存)后,速度提升至 15–20 token/秒。

Sabiá 是什么,我在哪里下载它?

Sabiá-3 是巴西公司 Maritaca AI 推出的葡萄牙语专用模型。从 https://huggingface.co/maritaca-ai 下载 GGUF 文件,并使用 llama.cpp 或 LM Studio 运行。它不在 Ollama 库中提供。

Qwen3 对巴西葡萄牙语的理解与欧洲葡萄牙语不同吗?

Qwen3 处理两种变体。当用 PT-BR 编写提示词时(使用「você」和巴西词汇),它会用 PT-BR 回复。为获得最佳结果,请明确指定你想要的变体。

Llama 3.1 对葡萄牙语好用吗?

是的,Llama 3.1 8B 位列 2026 年葡萄牙语本地模型的前三名。它通过 Ollama 提供,为通用用途生成良好的 PT-BR 输出。

我如何为巴西葡萄牙语用途安装 Ollama?

从 ollama.com 安装 Ollama(所有语言流程相同),然后运行:ollama run qwen3:8b。请参阅 /zh/local-llms/how-to-install-ollama 上的完整 Ollama 安装指南。

使用本地 LLM 有助于 LGPD 合规吗?

是的。在本地运行 LLM 意味着数据保留在你自己的基础设施上,不会发送到第三方云提供商,从而简化 LGPD 合规。详情请参阅配套的 LGPD 文章。

哪个基准测试葡萄牙语 LLM?

PoETa v2 是一个葡萄牙语评估基准。对于实际用途,用真实的 PT-BR 任务进行手动测试是最可靠的质量检查,因为没有与英语基准等同的单一标准化巴西葡萄牙语基准。

Qwen3 能处理正式的巴西葡萄牙语商务写作吗?

可以。用「escreva em português formal do Brasil」或「português brasileiro formal」编写提示词,即可获得一致的正式 você 形式商务输出。

Tucano 是什么?

Tucano 是 C4AI-USP(圣保罗大学)推出的开放权重葡萄牙语语言模型。它专为葡萄牙语设计,在资源受限的环境中很高效。在 HuggingFace 上提供。

来源

  • SiliconFlow (2026). "Best Open-Source LLM for Portuguese Language Tasks." — 葡萄牙语前 3 名模型,包括 Qwen3 和 Llama 3.1 8B
  • Maritaca AI. "Sabiá-3 Model Card." HuggingFace — https://huggingface.co/maritaca-ai
  • Qwen Team (2024). "Qwen Technical Report." arXiv — Qwen3 训练数据:36 万亿个 token,119 种语言
  • PoETa v2 benchmark — 面向 LLM 的葡萄牙语评估工具包
  • C4AI-USP. "Tucano: Open-weight Portuguese LLM." HuggingFace

关于第三方事实的说明

本文引用了第三方AI模型、基准测试、价格和许可证。AI领域变化迅速。基准分数、许可条款、模型名称和API价格可能在写作时间和您阅读时之间发生变化。在根据本文做出部署或合规决策之前,请在每个提供商的官方来源核实当前数据:Hugging Face模型卡用于许可证和基准测试,提供商网站用于API定价,EUR-Lex用于当前GDPR和EU AI法案文本。本文反映截至2026年5月的公开可用信息。

使用本地LLM、您自己的API密钥或两者运行PromptQuorum — 您来决定使用哪个后端。

加入PromptQuorum等待列表 →

← 返回本地LLM

巴西葡萄牙语最佳本地 LLM 2026:Qwen3、Sabiá 及更多 | PromptQuorum