Key Takeaways
- يُعد Qwen3 8B الخيار العملي الأفضل: يعمل بذاكرة VRAM سعة 8 جيجابايت عبر Ollama (`ollama run qwen3:8b`)، بمخرجات قوية بالبرتغالية البرازيلية
- Qwen3 14B / 32B لجودة أعلى إذا كان لديك 16 جيجابايت+ من VRAM (`ollama run qwen3:14b` / `ollama run qwen3:32b`)
- Llama 3.1 8B تنافسي للبرتغالية وأصلي على Ollama (`ollama run llama3.1:8b`)
- Sabiá-3 (Maritaca AI) يحقق جودة برتغالية قريبة من GPT-4o، لكنه ليس على Ollama — التنزيل من HuggingFace مطلوب
- اختبر جودة PT-BR بنفسك: اكتب المُوجِّه بـ PT-BR، وتحقق من استخدام você/tu والمفردات والقواعد
- تجنب النماذج المدربة أساسًا على الإنجليزية للاستخدام الإنتاجي الموجَّه للبرتغالية
لماذا يهم اختيار النموذج للبرتغالية البرازيلية
لاختيار النموذج تأثير كبير على جودة المخرجات بالبرتغالية البرازيلية. فالنماذج المدربة أساسًا على بيانات إنجليزية تنتج أخطاءً نحوية، ومفردات البرتغالية الأوروبية (ficheiro بدلاً من arquivo، وecrã بدلاً من tela)، وصيغ ضمائر خاطئة (tu بدلاً من você كضمير فاعل قياسي في البرتغالية البرازيلية).
تحدد ثلاثة عوامل جودة PT-BR: حجم النص البرتغالي في بيانات التدريب، وكفاءة الترميز للمفردات البرتغالية، وما إذا كان النموذج قد خضع للضبط الدقيق على تعليمات برتغالية. وعادةً ما تنتج النماذج التي تقل فيها بيانات التدريب البرتغالية عن 5% مخرجات متكلفة تبدو وكأنها ترجمة.
دُرّب Qwen3 على نحو 36 تريليون توكن عبر 119 لغة، مما يمنحه تغطية متعددة اللغات قوية. وقد صُمم Sabiá-3 من Maritaca AI خصيصًا للبرتغالية ويحقق أداءً قريبًا من GPT-4o في المهام البرتغالية.
للبرتغالية البرازيلية، اختر نموذجًا ببيانات تدريب متعددة اللغات موثّقة — Qwen3 أو Llama 3.1 أو Sabiá-3 — لتجنب مفردات البرتغالية الأوروبية وصيغ الضمائر غير الصحيحة.
للبرتغالية متغيّران رئيسيان: البرتغالية البرازيلية (PT-BR) والبرتغالية الأوروبية (PT-PT). يختلفان في المفردات والقواعد واستخدام الضمائر. "Você" هو القياسي في البرازيل؛ و"tu" أكثر شيوعًا في البرتغال. و"Arquivo" (ملف) و"tela" (شاشة) برازيليتان؛ بينما "ficheiro" و"ecrã" أوروبيتان. والنموذج الذي يستخدم البرتغالية الأوروبية افتراضيًا يبدو غير طبيعي للمستخدمين البرازيليين وقد يسبب أخطاءً في المستندات المهنية.
أفضل نماذج LLM المحلية للبرتغالية البرازيلية 2026
النماذج أدناه مرتبة وفق مزيج من جودة المخرجات بالبرتغالية البرازيلية، وكفاءة VRAM، وسهولة التثبيت. ويمكن تنزيل جميع النماذج المتوافقة مع Ollama وتشغيلها بأمر واحد.
| النموذج | الحجم | VRAM (Q4) | جودة PT-BR | على Ollama؟ | الأفضل لـ |
|---|---|---|---|---|---|
| Qwen3 8B | 8B | ~7 GB | جيدة جدًا | نعم (ollama run qwen3:8b) | أفضل خيار محلي شامل للبرتغالية |
| Qwen3 14B | 14B | ~9 GB | ممتازة | نعم (ollama run qwen3:14b) | جودة أعلى، تفاصيل أدق |
| Qwen3 32B | 32B | ~20 GB | ممتازة+ | نعم (ollama run qwen3:32b) | أفضل جودة مع 24 جيجابايت من VRAM |
| Llama 3.1 8B | 8B | ~7 GB | جيدة | نعم (ollama run llama3.1:8b) | البرتغالية العامة، تنافسي |
| Gemma 3 27B | 27B | ~18 GB | جيدة | نعم (ollama run gemma3:27b) | دعم لغوي واسع (أكثر من 35 لغة) |
| Sabiá-3 | ~7B | ~7 GB | قريبة من GPT-4o | لا (عبر HuggingFace فقط) | أفضل جودة برتغالية، أصعب في التشغيل |
Sabiá-3 غير متوفر على Ollama. يجب تنزيله من HuggingFace (https://huggingface.co/maritaca-ai) وتشغيله باستخدام llama.cpp أو LM Studio. ويمكن تثبيت جميع النماذج الأخرى بأمر ollama pull واحد.
دليل VRAM لمستخدمي البرتغالية البرازيلية
تحدد ذاكرة VRAM المتاحة لديك النماذج التي يمكنك تشغيلها. وتفترض جميع التوصيات تكميمًا من نوع Q4_K_M عبر Ollama أو llama.cpp.
- 8 جيجابايت VRAM / 16 جيجابايت RAM: Qwen3 8B (~7 GB)، وLlama 3.1 8B (~7 GB)، وSabiá-3 (~7 GB عبر llama.cpp مع تنزيل GGUF)
- 12 جيجابايت VRAM: جميع نماذج 8B براحة؛ وQwen3 14B بصيغة Q4_K_M (~9 GB)
- 16 جيجابايت VRAM: Qwen3 14B مع هامش؛ وGemma 3 12B
- 24 جيجابايت VRAM: Qwen3 32B (~20 GB)، وGemma 3 27B (~18 GB)
- وحدة المعالجة المركزية فقط (16 جيجابايت RAM): Qwen3 8B بنحو 2–4 توكن/ثانية عبر Ollama؛ صالح للمهام الدفعية، بطيء للدردشة التفاعلية
كيفية تشغيل Sabiá-3 (غير متوفر على Ollama)
طُوِّر Sabiá-3 بواسطة Maritaca AI، وهي شركة برازيلية متخصصة في نماذج اللغة البرتغالية. ويحقق أداءً قريبًا من GPT-4o في المهام البرتغالية، وهو أقوى نموذج مفتوح الأوزان للبرتغالية البرازيلية.
Sabiá-3 غير متوفر في مكتبة نماذج Ollama. ولتشغيله محليًا، نزّل ملفات GGUF من صفحة HuggingFace الخاصة بـ Maritaca AI على https://huggingface.co/maritaca-ai وشغّلها باستخدام llama.cpp أو LM Studio. يدعم LM Studio التحميل المباشر لملفات GGUF من HuggingFace عبر واجهة بحث مدمجة — ابحث عن "maritaca" في متصفح النماذج في LM Studio.
استند الجيل الأول من Sabiá (Sabiá-7B وSabiá-65B) إلى بنية Llama. ويواصل Sabiá-3 هذا التقليد القائم على الضبط الدقيق الموجَّه للبرتغالية على نموذج أساسي قوي.
- مسار التنزيل: https://huggingface.co/maritaca-ai
- التشغيل باستخدام: llama.cpp (سطر الأوامر) أو LM Studio (واجهة رسومية، يُوصى بها للمبتدئين)
- متطلب VRAM: نحو 7 جيجابايت بتكميم Q4
- ملاحظة: لا يوجد أمر `ollama run sabia` — فـ Sabiá ليس في مكتبة Ollama
كيفية اختبار جودة البرتغالية البرازيلية
لا يوجد معيار قياسي موحّد للبرتغالية البرازيلية يكافئ المعايير الإنجليزية. وPoETa v2 هو معيار تقييم باللغة البرتغالية، لكن أكثر فحوص الجودة موثوقية هو الاختبار العملي بمهام PT-BR حقيقية.
علامات سوء مخرجات PT-BR: استخدام "tu" كضمير فاعل (عُرف البرتغالية الأوروبية)، واستخدام "ficheiro" بدلاً من "arquivo"، واستخدام "ecrã" بدلاً من "tela"، وصياغة ركيكة تبدو كترجمة من الإنجليزية، وتصريفات فعلية غير صحيحة.
- اختبار البريد الإلكتروني المهني: اطلب من النموذج كتابة بريد إلكتروني مهني رسمي بـ "português formal do Brasil" — تحقق من صيغة você و"Prezado/a" والمفردات التجارية البرازيلية
- فحص المفردات: اسأل "Como se chama um arquivo de computador em português do Brasil?" — يجيب النموذج الجيد بـ "arquivo"؛ وقد يجيب النموذج الضعيف الضبط بـ "ficheiro"
- صيغة الضمير: اكتب المُوجِّه بـ "Como você está?" — تحقق من أن الردود اللاحقة تستخدم "você" باتساق، وليس "tu"
- السجل القانوني/الرسمي: اطلب بندًا تعاقديًا موجزًا بـ PT-BR — تحقق من صيغ الصيغة الشرطية الصحيحة والمفردات القانونية البرازيلية
- الوعي الإقليمي: اسأل "Qual é a diferença entre português do Brasil e português de Portugal?" — ينبغي أن يقدم النموذج تمييزات دقيقة وواثقة
الأسئلة الشائعة
ما هو أفضل نموذج LLM محلي للبرتغالية البرازيلية في 2026؟
يُعد Qwen3 8B الخيار العملي الأفضل: يعمل بذاكرة VRAM سعة 8 جيجابايت عبر Ollama، ودُرّب على 36 تريليون توكن عبر 119 لغة. وللحصول على أعلى جودة PT-BR، يقترب Sabiá-3 من Maritaca AI من أداء GPT-4o لكنه يتطلب التنزيل من HuggingFace.
هل يمكنني تشغيل نماذج LLM المحلية على حاسوب محمول عادي؟
نعم. تستطيع معظم الحواسيب المحمولة الحديثة المزوّدة بذاكرة RAM سعة 16 جيجابايت تشغيل Qwen3 8B عبر Ollama بسرعة 2–4 توكن/ثانية على وحدة المعالجة المركزية فقط. ومع وحدة معالجة رسوميات مخصصة (8 جيجابايت VRAM)، ترتفع السرعة إلى 15–20 توكن/ثانية.
ما هو Sabiá وأين يمكنني تنزيله؟
Sabiá-3 هو نموذج متخصص في البرتغالية من Maritaca AI، وهي شركة برازيلية. نزّل ملفات GGUF من https://huggingface.co/maritaca-ai وشغّلها باستخدام llama.cpp أو LM Studio. وهو غير متوفر في مكتبة Ollama.
هل يفهم Qwen3 البرتغالية البرازيلية بشكل مختلف عن البرتغالية الأوروبية؟
يتعامل Qwen3 مع المتغيّرين. وعند توجيهه بـ PT-BR (باستخدام "você" والمفردات البرازيلية)، يرد بـ PT-BR. وجِّهه صراحةً بالمتغيّر الذي تريده للحصول على أفضل النتائج.
هل Llama 3.1 جيد للبرتغالية؟
نعم، يُعد Llama 3.1 8B من أفضل ثلاثة نماذج محلية للبرتغالية في 2026. وهو متوفر عبر Ollama وينتج مخرجات PT-BR جيدة للاستخدام العام.
كيف أثبّت Ollama لاستخدام البرتغالية البرازيلية؟
ثبّت Ollama من ollama.com (العملية نفسها لجميع اللغات)، ثم نفّذ: ollama run qwen3:8b. اطّلع على دليل تثبيت Ollama الكامل على /ar/local-llms/how-to-install-ollama.
هل يساعد استخدام نموذج LLM محلي في الامتثال لـ LGPD؟
نعم. يعني تشغيل نماذج LLM محليًا أن البيانات تبقى على بنيتك التحتية الخاصة ولا تُرسَل إلى مزودي السحابة الخارجيين، مما يبسّط الامتثال لـ LGPD. اطّلع على مقال LGPD المصاحب لمزيد من التفاصيل.
ما المعيار الذي يختبر نماذج LLM البرتغالية؟
PoETa v2 هو معيار تقييم باللغة البرتغالية. وللاستخدام العملي، يُعد الاختبار اليدوي بمهام PT-BR حقيقية أكثر فحوص الجودة موثوقية، إذ لا يوجد معيار قياسي موحّد للبرتغالية البرازيلية يكافئ المعايير الإنجليزية.
هل يستطيع Qwen3 التعامل مع الكتابة التجارية الرسمية بالبرتغالية البرازيلية؟
نعم. وجِّهه بـ "escreva em português formal do Brasil" أو "português brasileiro formal" للحصول على مخرجات تجارية رسمية متسقة بصيغة você.
ما هو Tucano؟
Tucano هو نموذج لغة برتغالي مفتوح الأوزان من C4AI-USP (جامعة ساو باولو). صُمم خصيصًا للبرتغالية وهو فعّال في البيئات محدودة الموارد. متوفر على HuggingFace.
قراءات ذات صلة
- الامتثال لـ LGPD باستخدام نماذج LLM المحلية (البرازيل 2026) — كيف تبسّط نماذج LLM المحلية الامتثال لبيانات LGPD
- أفضل نماذج LLM المحلية للبرتغالية البرازيلية — Versão em Português
- نماذج LLM المحلية متعددة اللغات — دليل لتشغيل نماذج LLM بعدة لغات
- ما هي نماذج LLM المحلية؟
- كيفية تثبيت Ollama
- أفضل نماذج LLM المحلية 2026
- الامتثال لـ LGPD — النسخة البرتغالية
المصادر
- SiliconFlow (2026). "Best Open-Source LLM for Portuguese Language Tasks." — أفضل 3 نماذج للبرتغالية بما في ذلك Qwen3 وLlama 3.1 8B
- Maritaca AI. "Sabiá-3 Model Card." HuggingFace — https://huggingface.co/maritaca-ai
- Qwen Team (2024). "Qwen Technical Report." arXiv — بيانات تدريب Qwen3: 36 تريليون توكن، 119 لغة
- PoETa v2 benchmark — مجموعة أدوات تقييم اللغة البرتغالية لنماذج LLM
- C4AI-USP. "Tucano: Open-weight Portuguese LLM." HuggingFace