Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/أفضل نماذج LLM العربية المحلية: Jais وFalcon وتشغيل الذكاء الاصطناعي العربي داخل المؤسسة (2026)
Best Models

أفضل نماذج LLM العربية المحلية: Jais وFalcon وتشغيل الذكاء الاصطناعي العربي داخل المؤسسة (2026)

·13 دقيقة للقراءة·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

يُعد Jais 30B (Core42/G42، أبوظبي، Apache 2.0) وFalcon Arabic 7B (TII أبوظبي) أفضل نماذج LLM المحلية العربية الأصيلة في 2026. للأعباء متعددة اللغات مع دعم عربي قوي، يتصدر Qwen3-8B معايير HELM Arabic بين النماذج المصممة لأجهزة المستهلكين. تعمل النماذج الثلاثة جميعها داخل المؤسسة عبر Ollama أو vLLM، مع إبقاء البيانات الشخصية باللغة العربية داخل الحدود الوطنية.

يُعد Jais 30B (Core42/G42، أبوظبي، Apache 2.0) وFalcon Arabic 7B (TII، أبوظبي) أفضل نماذج LLM المحلية العربية الأصيلة في 2026. للأعباء متعددة اللغات مع دعم عربي قوي، يتصدر Qwen3-8B معايير HELM Arabic بين النماذج المصممة لأجهزة المستهلكين. تعمل النماذج الثلاثة جميعها داخل المؤسسة عبر Ollama أو vLLM، مع إبقاء البيانات باللغة العربية داخل الحدود الوطنية. يصنّف هذا الدليل النماذج، ويقدّم جدول VRAM، ويوضّح كيفية نشر الذكاء الاصطناعي العربي وتقييمه محليًا.

Key Takeaways

  • Jais 30B (Core42/G42، أبوظبي): أفضل نموذج LLM محلي عربي أصيل في 2026. مُدرَّب على 126B رمز عربي + 251B رمز إنجليزي. ترخيص Apache 2.0. يحتاج ~18-20 GB VRAM عند تكميم Q4 (GPU متعدد أو GPU مؤسسي للتشغيل الكامل بدقة FP16).
  • Falcon Arabic 7B (TII، أبوظبي): نموذج إماراتي أصيل مركّز على العربية. يعمل على بطاقات GPU للمستهلكين: Q4_K_M ~5 GB VRAM. مبني على معمارية Falcon 3-7B، ومُدرَّب على مجموعات بيانات عربية أصيلة (غير مترجمة).
  • Qwen3-8B (Alibaba Cloud): أفضل خيار متعدد اللغات مع دعم عربي قوي. حقق متوسط 0.786 على HELM Arabic (إصدار 235B)؛ ويناسب الإصدار 8B تكميم Q4 ضمن ~5-6 GB VRAM. دعم 119 لغة.
  • ALLaM 34B (HUMAIN/SDAIA، السعودية): النموذج الوطني السعودي، يُشغِّل تطبيق HUMAIN Chat. ترخيص بحثي/غير تجاري للوصول العام. متاح على Microsoft Azure AI (إصدار 7B).
  • MSA مقابل اللهجة: تتعامل جميع النماذج جيدًا مع اللغة العربية الفصحى (MSA). تتفاوت تغطية اللهجات — اختبر حالة استخدامك المحددة بأمثلة حقيقية من اللهجة المستهدفة.
  • النشر: يدعم Ollama نموذج Falcon 3 أصليًا (ollama pull falcon3:7b). أما Jais وALLaM فيتطلبان التحويل إلى GGUF من Hugging Face لاستخدامهما مع llama.cpp/Ollama.
  • السيادة على البيانات: تشغيل معالجة اللغة الطبيعية العربية محليًا يُبقي البيانات الشخصية داخل الحدود الوطنية — بما يتوافق مع PDPL الإماراتي وSaudi NDMO وأهداف السيادة على البيانات في الخليج.

يُعد Jais 30B (Apache 2.0، أبوظبي) وFalcon Arabic 7B (TII، أبوظبي) أفضل نماذج LLM المحلية العربية الأصيلة في 2026، مع تصدّر Qwen3-8B لمعايير العربية متعددة اللغات لأجهزة المستهلكين.

أفضل ذكاء اصطناعي عربي يمكنك تشغيله على خادمك الخاص: Jais 30B لأفضل جودة عربية (يحتاج GPU متطور)، أو Falcon Arabic 7B للحواسيب العادية، أو Qwen3-8B إذا كنت بحاجة إلى لغات أخرى أيضًا.

لماذا تهم نماذج LLM المحلية القادرة على العربية

العربية هي اللغة الأم لأكثر من 300 مليون متحدث عبر الخليج وبلاد الشام وشمال إفريقيا. بالنسبة للذكاء الاصطناعي المؤسسي في الإمارات والسعودية وقطر ومصر وما بعدها، تُعد جودة اللغة العربية متطلبًا عمليًا — لا أمرًا ثانويًا.

MSA مقابل العربية العامية. اللغة العربية الفصحى (الفصحى / MSA) هي المعيار الكتابي الرسمي المستخدم في الإعلام والحكومة والتعليم. تختلف اللهجات الإقليمية (الخليجية والمصرية والشامية والمغربية) اختلافًا كبيرًا — فالنموذج المُدرَّب على الفصحى فقط قد يسيء فهم مدخلات اللهجة الخليجية. ينبغي لحالات الاستخدام المؤسسية اختبار الاثنين.

السيادة على البيانات هي الدافع الثاني. تُقيّد الجهات التنظيمية الخليجية (PDPL الإماراتي، NDMO السعودي) نقل البيانات الشخصية عبر الحدود. إرسال بيانات العملاء أو المرضى العربية إلى واجهات برمجة تطبيقات سحابية مستضافة في الولايات المتحدة يُنشئ مخاطر نقل. تشغيل معالجة اللغة الطبيعية العربية محليًا يزيل تلك المخاطر. راجع دليل السيادة على البيانات وPDPL الإماراتي.

فجوة جودة "الإنجليزية المترجمة". تدّعي العديد من نماذج LLM للأغراض العامة دعم العربية لكنها ضُبطت بدقة بشكل أساسي على بيانات إنجليزية مترجمة. قد يكون ترميز العربية غير فعّال (تتطلب الكتابة العربية ترميزًا صحيحًا من اليمين إلى اليسار). أما النماذج ثنائية اللغة حقًا مثل Jais وFalcon Arabic فقد دُرِّبت أصليًا على نصوص عربية.

أفضل نماذج LLM العربية المحلية: مرتبة للنشر داخل المؤسسة

مرتبة حسب القدرة على اللغة العربية والملاءمة للنشر المحلي/داخل المؤسسة.

  • 1. Jais 30B — أفضل جودة عربية (Apache 2.0، جاهز داخل المؤسسة). المطوّر: Core42 / Inception AI (مجموعة G42، أبوظبي) + أبحاث MBZUAI + تدريب Cerebras. التدريب: 126B رمز عربي + 251B رمز إنجليزي + 50B رمز برمجي. يُظهر التقييم البشري أن Jais 30B يتفوق على Jais 13B في العربية في 96% من التقييمات. الترخيص: Apache 2.0 (مفتوح بالكامل، الاستخدام التجاري مسموح). Hugging Face: inceptionai/jais-30b-v3. VRAM: تقدير ~18-20 GB عند Q4 (GPU مؤسسي أو متعدد لدقة FP16). الأفضل لـ: أعلى جودة عربية في معالجة المستندات المؤسسية ودعم العملاء والنشر الحكومي حيث تكون العربية لغة أساسية.
  • 2. Falcon Arabic 7B — الأفضل لأجهزة المستهلكين (TII أبوظبي). المطوّر: مؤسسة الابتكار التقني (TII)، أبوظبي (تحت مجلس أبحاث التكنولوجيا المتقدمة). الأساس: معمارية Falcon 3-7B (صدرت في December 17, 2024). التدريب: مجموعات بيانات عربية أصيلة (غير مترجمة)، الفصحى واللهجات الإقليمية. الترخيص: Falcon LLM License — متساهل، الاستخدام التجاري مسموح. VRAM: Q4_K_M ~5 GB — يعمل على RTX 4060 8GB وRTX 3060 12GB وما يعادلها. الأفضل لـ: عمليات النشر على أجهزة المستهلكين والمستخدمين المتقدمين؛ نموذج إماراتي أصيل من مؤسسة في أبوظبي.
  • 3. Qwen3-8B — أفضل خيار متعدد اللغات مع دعم عربي قوي (Alibaba Cloud). المطوّر: Alibaba Cloud. اللغات: 119 لغة ولهجة. المعيار: حقق Qwen3-235B-A22B متوسط 0.786 على HELM Arabic؛ ويُوصى بالإصدار 8B للأجهزة المحلية. الترخيص: Apache 2.0. VRAM: Q4_K_M ~5-6 GB. الأفضل لـ: الفرق التي تحتاج العربية + الإنجليزية + لغات أخرى في نموذج واحد؛ مدعوم على نطاق واسع في Ollama (ollama pull qwen3:8b).
  • 4. ALLaM 34B / 7B — النموذج الوطني السعودي (HUMAIN/SDAIA). المطوّر: SDAIA (الهيئة السعودية للبيانات والذكاء الاصطناعي) / HUMAIN (الشركة الوطنية السعودية للذكاء الاصطناعي). الإصدارات: 7B (Hugging Face، وصول بحثي) و34B (يُشغِّل HUMAIN Chat). Azure: ALLaM-2-7B-Instruct متاح على Microsoft Azure AI منذ September 2024. الترخيص: بحثي/غير تجاري للوصول العام؛ الترخيص المؤسسي عبر HUMAIN. الأفضل لـ: عمليات النشر الحكومية والمؤسسية السعودية؛ نموذج سيادي متوافق مع رؤية 2030.
  • 5. Llama 3.1-8B-Instruct — أفضل خط أساس متعدد اللغات العام (Meta). المطوّر: Meta. اللغات: أكثر من 20 بما في ذلك العربية. الترخيص: Meta Llama 3.1 License — متساهل، استخدام تجاري واسع. VRAM: Q4_K_M ~5-6 GB. الأفضل لـ: الأعباء العربية التي تحتاج أيضًا دعمًا متعدد اللغات واسعًا؛ منتشر على نطاق واسع مع دعم مجتمعي كبير. استخدم Qwen3-8B أو Jais إذا كانت جودة العربية هي الاهتمام الأساسي.
  • 6. Gemma 3 (4B/12B) — متعدد اللغات قوي يشمل العربية (Google). المطوّر: Google. اللغات: أكثر من 140 بما في ذلك العربية (الفصحى والكلاسيكية). الترخيص: Gemma Terms of Use (متساهل لمعظم الاستخدامات التجارية). VRAM: 4B عند Q4 ~3 GB؛ 12B عند Q4 ~8 GB. الأفضل لـ: الفرق الموجودة بالفعل في منظومة Google؛ الترجمة والتلخيص متعدد اللغات؛ معالجة المستندات بالكتابة العربية.

متطلبات VRAM لنماذج LLM العربية المحلية

متطلبات VRAM حسب النموذج والتكميم. الصفوف المميزة بـ * هي تقديرات قائمة على تحجيم المعاملات (لم يُعثر على معيار رسمي). تحقّق دائمًا من أجهزتك المحددة قبل النشر.

النموذجالمعاملاتVRAM عند Q4_K_MVRAM عند FP16الحد الأدنى للأجهزة
Falcon Arabic7B~5 GB~16.7 GBRTX 4060 8 GB / RTX 3060 12 GB
Jais 13B13B~8-10 GB*~26 GB*RTX 3090 24 GB (Q4)
Jais 30B30B~18-20 GB*~60 GB*RTX 4090 24 GB (Q4 ضيق)، A100 40 GB (FP16)
ALLaM7B~5 GB*~16 GB*RTX 4060 8 GB / RTX 3060 12 GB
Qwen38B~5-6 GB~16 GBRTX 4060 8 GB / RTX 3060 12 GB
Llama 3.18B~5-6 GB~16 GBRTX 4060 8 GB / RTX 3060 12 GB
Gemma 34B~3 GB~8 GBRTX 3060 8 GB

كيفية تشغيل النماذج العربية داخل المؤسسة باستخدام Ollama

دليل خطوة بخطوة لنشر النماذج العربية محليًا على خادم GPU أو محطة عمل.

  1. 1
    ثبّت Ollama: curl -fsSL https://ollama.com/install.sh | sh (لينكس) أو نزّله من ollama.com (ويندوز/ماك). يدعم Falcon 3 أصليًا.
  2. 2
    اسحب Falcon Arabic 7B: ollama pull falcon3:7b — تنزيل بحجم ~5 GB. التشغيل: ollama run falcon3:7b. اختبر العربية بموجّه مثل "اكتب قصيدة عن أبوظبي".
  3. 3
    اسحب Qwen3-8B للاستخدام متعدد اللغات: ollama pull qwen3:8b — تنزيل بحجم ~5 GB. عربية قوية عبر سياقات الفصحى واللهجة.
  4. 4
    لـ Jais 30B: نزّله من Hugging Face (inceptionai/jais-30b-v3)، وحوّله إلى GGUF بأدوات التحويل في llama.cpp، وكمّمه إلى Q4_K_M، ثم حمّله مع Ollama (ollama create jais-30b -f Modelfile) أو عبر خادم llama.cpp.
  5. 5
    الاستنتاج في الإنتاج: استخدم vLLM لتقديم واجهة برمجة تطبيقات عربية عالية الإنتاجية. يدعم vLLM نموذجي Falcon 3 وQwen3 أصليًا. اعرضه عبر نقطة نهاية متوافقة مع OpenAI على localhost:8000.
  6. 6
    نصيحة الموجّه العربي: حدّد اللغة دائمًا — "أجب باللغة العربية الفصحى". للهجة، أدرج أمثلة جمل من اللهجة المستهدفة في موجّه النظام.

كيفية تقييم جودة نموذج LLM العربي لحالة استخدامك

تمنحك المعايير نقطة انطلاق. لكن جودة العربية في العالم الواقعي يجب أن تُقيَّم على مجالك ولهجتك المحددين.

  • HELM Arabic (Stanford CRFM): تقييم شامل متعدد اللغات. حقق Qwen3-235B متوسط 0.786. استخدمه كنقطة مقارنة نسبية بين النماذج — لا كدرجة جودة مطلقة لمجالك.
  • ALUE (تقييم فهم اللغة العربية): 8 مهام لفهم اللغة الطبيعية بما في ذلك تحليل المشاعر واكتشاف الموقف وتحديد اللهجة. مجموعة بيانات تعتمد بكثافة على تويتر — جيدة لحالات استخدام وسائل التواصل الاجتماعي وملاحظات العملاء.
  • ArabicMMLU: مهام المعرفة الأكاديمية والمهنية بالفصحى. أفضل معيار لجودة قواعد المعرفة المؤسسية والأسئلة والأجوبة على المستندات.
  • AraBench: جودة الترجمة الخاصة باللهجات (المصرية والسورية والخليجية). إذا كانت حالة استخدامك تتضمن العربية الخليجية تحديدًا، اختبر هنا.
  • تقييمك الخاص (موصى به): اكتب 20-30 موجّه اختبار في مجالك الفعلي ولهجتك المستهدفة. قيّم المخرجات على (1) الدقة الواقعية، و(2) سلامة قواعد اللغة العربية، و(3) السجل المناسب (رسمي مقابل لهجة)، و(4) صحة البنية من اليمين إلى اليسار في الاستدلال.
  • علامة تحذير: إذا تحوّل النموذج إلى الإنجليزية في منتصف الرد دون طلب، أو أنتج صياغة "مترجمة" (ترجمات حرفية من أنماط إنجليزية)، فالجودة غير كافية للاستخدام العربي الإنتاجي.

أسئلة شائعة حول نماذج LLM العربية المحلية

هل يمكنني تشغيل نموذج LLM عربي على حاسوب محمول عادي للألعاب؟

نعم، للنماذج من فئة 7B عند تكميم Q4. يتطلب Falcon Arabic 7B وQwen3-8B نحو ~5-6 GB VRAM — ومعظم الحواسيب المحمولة للألعاب المزوّدة بـ RTX 4060 (8 GB) أو RTX 3060 (12 GB) يمكنها تشغيلها. أما Jais 30B فيتطلب GPU مكتبي متطور (RTX 4090 24 GB) أو GPU مؤسسي عند تكميم Q4.

ما الفرق بين Jais وFalcon Arabic؟

كلاهما نموذجان قادران على العربية من أصل أبوظبي. Jais (Core42/G42) أكبر (حتى 30B) ومُدرَّب تحديدًا كنموذج عربي-إنجليزي ثنائي اللغة بـ 126B رمز عربي — مُحسَّن لجودة العربية على نطاق مؤسسي. أما Falcon Arabic فهو نموذج 7B من TII (مؤسسة أبوظبية مختلفة) مبني على معمارية Falcon 3 الأوسع — مناسب لـ GPU المستهلكين وجزء من منظومة الذكاء الاصطناعي الإماراتية. لأفضل جودة عربية: Jais 30B. لأجهزة المستهلكين: Falcon Arabic 7B.

هل يدعم Qwen3 العربية بنفس جودة النماذج العربية المخصصة؟

يتمتع Qwen3 بدعم عربي عام قوي جدًا (119 لغة، درجة HELM Arabic متصدرة). لعمليات النشر المؤسسية العربية البحتة التي تتطلب أفضل جودة عربية على الإطلاق، يُفضَّل Jais 30B عمومًا. أما للأعباء المختلطة متعددة اللغات حيث تكون العربية إحدى عدة لغات مطلوبة، فغالبًا ما يكون Qwen3-8B الخيار الأفضل بفضل اتساعه وسهولة نشره.

ما هو ALLaM وهل يمكنني استخدامه تجاريًا؟

ALLaM هو عائلة نماذج LLM وطنية سعودية متمحورة حول العربية من SDAIA (الآن تحت علامة HUMAIN). تحمل الإصدارات العامة (7B على Hugging Face، 7B على Azure AI) تراخيص بحثية/غير تجارية. للاستخدام التجاري في السعودية أو عمليات النشر المؤسسية، تواصل مع HUMAIN/SDAIA مباشرة. يُشغِّل ALLaM 34B تطبيق HUMAIN Chat الوطني لكن وصوله العام مقيّد.

كيف يؤثر ترميز العربية على جودة النموذج؟

تتطلب الكتابة العربية ترميزًا صحيحًا لتجنّب الأخطاء على مستوى الحروف. تستخدم النماذج المُدرَّبة أصليًا على العربية (Jais وFalcon Arabic) أدوات ترميز مُحسَّنة لصرف اللغة العربية. قد تُرمّز النماذج العامة متعددة اللغات العربية بشكل غير فعّال (تقسيم صرف الجذر والوزن)، مما يؤدي إلى تدهور الجودة على النصوص العربية المعقّدة. اختبر ببيانات إدخالك الفعلية قبل النشر الإنتاجي.

هل يمكن لنماذج LLM العربية المحلية التعامل مع مستندات اليمين إلى اليسار (RTL)؟

تولّد النماذج النص العربي في الاتجاه الصحيح من اليمين إلى اليسار — فالعربية ثنائية الاتجاه في Unicode وتنتج النماذج عربية RTL سليمة. يجب أن تتعامل واجهة تطبيقك مع عرض RTL (HTML dir="rtl"، CSS direction:rtl). تُرجع llama.cpp وOllama وvLLM نص Unicode العربي بشكل صحيح؛ وتتولى طبقة واجهة المستخدم الاتجاه.

ما أفضل نموذج LLM عربي لعمليات النشر الحكومية الإماراتية؟

Falcon Arabic 7B (من TII، أبوظبي) وJais 30B (من Core42/G42، أبوظبي) كلاهما نموذجان إماراتيان أصيلان لهما منشأ من مؤسسات بحثية مرتبطة بالحكومة الإماراتية. من حيث السيادة وقابلية التدقيق، هذان هما الخياران الأكثر توافقًا. ويمكن نشر كليهما داخل المؤسسة دون خروج أي بيانات من البنية التحتية الإماراتية. راجع دليل السيادة على البيانات وPDPL الإماراتي.

كيف أتعامل مع اللهجة العربية الخليجية مقابل الفصحى في الموجّهات؟

موجّه النظام الافتراضي: "أجب باللغة العربية الفصحى". للعربية الخليجية (الإماراتية والسعودية والكويتية)، أضف عبارات لهجة كأمثلة في موجّه النظام أو اضبط بدقة على بيانات المجال. تتعامل جميع النماذج المذكورة جيدًا مع الفصحى؛ وتتفاوت جودة اللهجة. اختبر تحديدًا بـ 5-10 استعلامات لهجة كأمثلة قبل افتراض الجودة الإنتاجية.

هل يمكنني ضبط Jais أو Falcon Arabic بدقة على بياناتي العربية الخاصة؟

نعم — كلاهما يستخدم تراخيص مفتوحة (Apache 2.0 لـ Jais، وFalcon LLM License لـ Falcon Arabic) تسمح بالضبط الدقيق. استخدم الضبط الدقيق بـ LoRA أو QLoRA مع أدوات مثل Unsloth أو مكتبة PEFT. يحسّن الضبط الدقيق على بيانات عربية خاصة بالمجال (قانونية، طبية، مالية) الجودة بشكل كبير لحالات الاستخدام المتخصصة. أبقِ بيانات الضبط الدقيق داخل المؤسسة للامتثال لـ PDPL.

ما الأجهزة التي أحتاجها لتشغيل Jais 30B محليًا؟

عند تكميم Q4_K_M، يتطلب Jais 30B ما يُقدَّر بـ 18-20 GB VRAM (تقدير — لا يوجد معيار رسمي). يمكن لـ NVIDIA RTX 4090 (24 GB) تشغيله عند Q4 بسياق متوسط؛ ويتعامل معه A100 40 GB بأريحية عند FP16. لإنتاجية الإنتاج، يُوصى ببطاقتي RTX 4090 في وضع GPU متعدد أو بطاقة A100/H100 واحدة. راجع دليل حاسبة VRAM.

المصادر

  • Technology Innovation Institute (TII) — إعلان Falcon 3، December 17, 2024 — tii.ae
  • صفحة نموذج Falcon 3 على Hugging Face — huggingface.co/tiiuae/Falcon3-7B-Instruct
  • Core42 / Cerebras — البيان الصحفي لـ Jais 30B — cerebras.ai وg42.ai
  • Jais 30B على Hugging Face — huggingface.co/inceptionai/jais-30b-v3
  • SDAIA / HUMAIN — إعلان ALLaM 34B، May 2025 — humain.ai
  • ALLaM-2-7B على Microsoft Azure AI — techcommunity.microsoft.com (September 2024)
  • HELM Arabic — Stanford CRFM، December 2025 — crfm.stanford.edu/2025/12/18/helm-arabic.html
  • Qwen3 Technical Report — arxiv.org/abs/2505.09388
  • ALUE Benchmark — aclanthology.org/2021.wanlp-1.18
  • TII Arabic LLM Benchmarks — github.com/tiiuae/Arabic-LLM-Benchmarks

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider’s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both — you pick the backend.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

أفضل نماذج الذكاء الاصطناعي العربية محليًا 2026