Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/ALLaM وAceGPT وأفضل نماذج LLM العربية السعودية المحلية (2026)
Best Models

ALLaM وAceGPT وأفضل نماذج LLM العربية السعودية المحلية (2026)

·11 دقيقة للقراءة·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

لنماذج الذكاء الاصطناعي المحلية العربية في السعودية، يُعد ALLaM 7B (HUMAIN/NCAI، رخصة Apache 2.0) النموذج الرائد المتاح علناً — بتسجيله 72–74% في AraLingBench مقابل 40–62% لنسخ Qwen — ويعمل محلياً عبر Ollama باستخدام أوزان GGUF. وAceGPT 7B/13B (KAUST + CUHKSZ) بديل لكنه يبدو غير مُصان منذ ديسمبر 2023.

تنتج طموحات السعودية القائمة على الذكاء الاصطناعي أولاً — بما في ذلك نماذج ALLaM من HUMAIN وعام 2026 الرسمي عاماً للذكاء الاصطناعي — جيلاً جديداً من نماذج LLM المحلية العربية الأصلية. لكن اختيار نموذج لأعباء العمل العربية ليس مجرد مسألة عدد معاملات: تسجّل النماذج متعددة اللغات من المزودين العالميين درجات أدنى بكثير من النماذج المتخصصة بالعربية في المهام الثقافية واللهجية، رغم طلاقتها النحوية. يغطي هذا الدليل ALLaM (HUMAIN/NCAI) وAceGPT (KAUST + CUHKSZ) وأبرز البدائل متعددة اللغات — مع بيانات معيارية مُتحقَّق منها، ومتطلبات VRAM، ودليل خطوة بخطوة لتشغيل ALLaM محلياً باستخدام Ollama.

Key Takeaways

  • ALLaM 7B هو أفضل نموذج عربي قابل للاستضافة الذاتية علناً — بناه NCAI/SDAIA (والآن تحت HUMAIN)، صادر برخصة Apache 2.0، بأوزان GGUF تعمل مباشرة في Ollama وllama.cpp.
  • فجوة المعايير حقيقية: يسجّل ALLaM-7B درجة 72–74% في AraLingBench، بينما تسجّل نسخ Qwen درجة 40–62% — فجوة 12–32 نقطة مئوية في المهام اللغوية العربية.
  • AceGPT (KAUST + CUHKSZ + SRIBD) بديل 7B/13B برخصة Apache 2.0، لكن آخر تحديث له على GitHub كان في ديسمبر 2023 — اعتبره غير مُصان.
  • الأمانة الثقافية ≠ الطلاقة النحوية. قد تكون النماذج المدرَّبة عالمياً صحيحة نحوياً لكن خاطئة ثقافياً؛ وضبط نموذج متعدد اللغات على العربية غالباً ما *يحسّن* جودة الفصحى بينما *يقلّل* دقة اللهجة — مفارقة موثَّقة.
  • مرجع VRAM سريع (Q4_K_M): 7B ≈ 6–8 GB، 13B ≈ 10–14 GB، 34B ≈ 20–24 GB، 70B ≈ 40–48 GB.
  • ALLaM 34B مملوك حصرياً — يشغّل HUMAIN Chat لكن دون أوزان علنية، لذا فإن النسخة 7B وحدها قابلة للاستضافة الذاتية اليوم.
  • زخم وطني: أعلنت السعودية 2026 عاماً للذكاء الاصطناعي، مسرّعةً تطوير النماذج العربية.

ALLaM 7B (رخصة Apache 2.0، جاهز لـ Ollama) هو النموذج العربي الرائد القابل للاستضافة الذاتية علناً، بتسجيله 72–74% في AraLingBench مقابل 40–62% لنسخ Qwen.

إذا احتجت ذكاءً اصطناعياً عربياً تشغّله على جهازك الخاص، فإن ALLaM 7B السعودي هو أفضل خيار مجاني حالياً. النماذج العالمية الكبيرة مثل Qwen تفهم النحو العربي لكنها غالباً ما تخطئ في الثقافة واللهجة.

لماذا تهم الأمانة الثقافية العربية للذكاء الاصطناعي المحلي

يمكن لنموذج أن ينتج عربية صحيحة نحوياً ويبقى خاطئاً ثقافياً — وللأعمال الموجَّهة للعملاء أو الحكومية في السعودية، الصحة الثقافية هي ما يهم.

الدليل المعياري متسق. في AraLingBench الذي يختبر الاستدلال الصرفي والنحوي العربي، تسجّل نماذج عائلة Qwen درجة 40–62% بينما تسجّل النماذج المتخصصة بالعربية مثل ALLaM-7B درجة 72–74%. تتركز فجوة الـ 12–32 نقطة مئوية في المجالات نفسها — الصرف والنحو والمستوى اللغوي — حيث تختلف العربية أكثر ما تختلف عن اللغات الأوروبية التي تُحسَّن لها النماذج العالمية.

الضبط الدقيق ليس حلاً مجانياً. توثّق الأبحاث حول مشهد نماذج LLM العربية (arXiv 2506.01340، 2026) مفارقة: ضبط نموذج متعدد اللغات على بيانات عربية غالباً ما يحسّن جودة العربية الفصحى الحديثة (MSA) بينما *يقلّل* دقة اللهجة. لا يمكنك ببساطة إلحاق الكفاءة العربية بنموذج عالمي وتوقّع أمانة لهجية.

معالجة اللهجة هي حيث تنهار النماذج العالمية بأوضح صورة. بالنسبة للنماذج الأصغر مفتوحة الأوزان، قد تنخفض دقة اللهجة بترميز ISO الصارم إلى ما يقارب 0.016–0.078 — أي أن النموذج ينتج عربية فصيحة بلهجة *خاطئة*. ويجد معيار AraDiCE (COLING 2025) أن النماذج المتخصصة بالعربية تتفوق على متعددة اللغات في اللهجة، رغم استمرار تحديات كبيرة في تحديد اللهجة وتوليدها عبر جميع النماذج.

السياق الثقافي والديني نقطة ضعف موثَّقة. يلاحظ المسح نفسه أن بيانات التدريب المتمحورة غربياً أو متعددة اللغات "تُدخل تحيزات ثقافية يمكن أن تُحدث عدم توافق بين النماذج وقيم وتوقعات المجتمعات الناطقة بالعربية" — مؤثرةً في كيفية تأطير النموذج للمواضيع الإسلامية والمخاطبة الرسمية والأعراف الاجتماعية.

توافق الجنس النحوي تحدٍّ معروف ومستمر: تطبّق العربية توافق الجنس على الأفعال والصفات والضمائر بطرق تختلف بنيوياً عن اللغات الأوروبية، وتخطئ النماذج المدرَّبة عالمياً في هذا بشكل دقيق روتينياً.

الأثر التجاري للنشر السعودي: إذا كانت حالة استخدامك محتوى عربياً موجَّهاً للعملاء، أو مراسلات رسمية، أو أي شيء يمس السياق الثقافي أو الديني، فإن النموذج المتخصص بالعربية يستحق المقايضة — ويجب أن يكون تمييز الفصحى عن اللهجة الخليجية جزءاً صريحاً من اختيارك للنموذج.

النماذج السعودية والعربية المحلية: ALLaM وAceGPT والبدائل متعددة اللغات

ALLaM 7B هو نقطة البداية الموصى بها للذكاء الاصطناعي العربي المستضاف ذاتياً؛ ويلخّص الجدول أدناه الخيارات الواقعية.

ALLaM بناه المركز الوطني للذكاء الاصطناعي (NCAI) في SDAIA بالشراكة مع IBM، ويُسوَّق الآن عبر HUMAIN — شركة ذكاء اصطناعي مملوكة لصندوق الاستثمارات العامة أُطلقت في مايو 2025. تمتد العائلة عبر نسخ 7B و13B و34B و70B، لكن النسخة 7B Instruct وحدها متاحة علناً (Apache 2.0، مع تسع تكميمات GGUF على Hugging Face). والنسخة 34B التي تشغّل HUMAIN Chat مملوكة حصرياً دون أوزان علنية.

AceGPT مشروع مشترك بين KAUST وجامعة هونغ كونغ الصينية بشنتشن (CUHKSZ) ومعهد شنتشن لأبحاث البيانات الضخمة (SRIBD) — وليس نموذجاً خاصاً بـ KAUST وحدها. يقدّم نسخ 7B و13B (أساسية ومحادثة) مبنية على LLaMA-2، برخصة Apache 2.0. وعند إطلاقه عام 2023 تفوق على Jais في المهام العربية، لكن آخر تحديث له على GitHub كان في ديسمبر 2023، فاعتبره غير مُصان.

Qwen2.5 هو أقوى بديل متعدد اللغات لتغطية لغوية واسعة، لكن كما تُظهر المعايير، فإنه يتأخر عن النماذج المتخصصة بالعربية في المهام الثقافية واللهجية رغم منظومته الأكبر.

Jais (13B/70B) مُدرَج للاكتمال، لكن لاحظ أنه إماراتي المنشأ (Core42/G42، أبوظبي)، وليس سعودياً. يبقى منافساً في مهام اللهجة العربية وهو برخصة Apache 2.0.

النموذجالمعاملاتVRAM (Q4_K_M)الرخصةOllamaالدرجة العربية
ALLaM 7B7B6–8 GBApache 2.0نعم (GGUF)72–74% (AraLingBench)
ALLaM 34B34B~20 GBمملوك حصرياًلا (دون أوزان علنية)غير مُقاس علناً
AceGPT 7B7B6–8 GBApache 2.0منفذ مجتمعيقوي عند الإطلاق (2023)
AceGPT 13B13B10–14 GBApache 2.0منفذ مجتمعيقوي عند الإطلاق (2023)
Qwen2.5 7B7B6–8 GBApache 2.0نعم40–62% (AraLingBench)
Qwen2.5 72B72B40–48 GBApache 2.0نعمأعلى، لكن تبقى فجوات ثقافية
Jais 13B (الإمارات)13B10–14 GBApache 2.0محدودمنافس في اللهجة

تشغيل ALLaM 7B محلياً باستخدام Ollama

يأتي ALLaM 7B كتكميمات GGUF على Hugging Face، فيمكنك تشغيله في Ollama بملف Modelfile من سطر واحد. اتبع هذه الخطوات.

  • بديل — llama.cpp مباشرة: llama-cli -m ALLaM-7B-Instruct-Q4_K_M.gguf --chat-template chatml -p "أكمل الجملة التالية:" لأقصى تحكم في طول السياق والمعاينة.
  • AceGPT عبر منفذ مجتمعي: ollama run salmatrafi/acegpt يسحب منفذ AceGPT المُصان مجتمعياً إن أردت المقارنة.
  • الحد الأدنى للأجهزة: وحدة GPU بسعة 8 GB من VRAM (RTX 3070/4060 أو أفضل) أو Apple Silicon بذاكرة موحَّدة 16 GB. حجِّم النماذج الأكبر بـ حاسبة VRAM.
  1. 1
    نزّل ملف GGUF من Hugging Face
    Why it matters: زُر humain-ai/ALLaM-7B-Instruct-preview على Hugging Face، وتصفّح التكميمات، ونزّل ALLaM-7B-Instruct-Q4_K_M.gguf (موصى به، ~4.5 GB) — أفضل توازن بين الجودة والحجم لوحدة GPU بسعة 8 GB.
  2. 2
    ثبّت Ollama
    Why it matters: نزّل Ollama من ollama.com لنظام تشغيلك. تحتاج نحو 8 GB من VRAM على وحدة GPU من NVIDIA، أو 16 GB من الذاكرة الموحَّدة على Apple Silicon، لتشغيل نموذج 7B بأريحية.
  3. 3
    أنشئ ملف Modelfile
    Why it matters: أنشئ ملفاً نصياً باسم Modelfile يحتوي على سطر واحد: FROM ./ALLaM-7B-Instruct-Q4_K_M.gguf — يخبر هذا Ollama بمكان الأوزان.
  4. 4
    سجّل النموذج في Ollama
    Why it matters: شغّل: ollama create allam-7b -f Modelfile. يستورد Ollama ملف GGUF ويتيحه كنموذج مُسمّى يمكنك استدعاؤه مراراً.
  5. 5
    شغّل الاستدلال بالعربية
    Why it matters: شغّل: ollama run allam-7b "اشرح مفهوم الذكاء الاصطناعي المحلي". يستجيب النموذج بالعربية الفصحى الحديثة.
  6. 6
    تحقّق ووجّه المخرجات العربية
    Why it matters: إذا رد النموذج بالإنجليزية، أضف موجّه نظام مثل "أجب دائماً باللغة العربية الفصحى" لتثبيت المستوى اللغوي واللغة.

كيفية التقييم الذاتي لجودة النموذج العربي

المعايير نقطة بداية، لكن عليك اختبار أي نموذج عربي على مجالك قبل النشر. استخدم هذه الفحوص.

  • اتساق الفصحى مقابل اللهجة: أرسل الموجّه نفسه بالعربية الفصحى الحديثة وباللهجة الخليجية، وتحقّق مما إذا كان النموذج يحافظ على المستوى اللغوي والمعنى عبر الاثنين.
  • اختبار السياق الثقافي: اسأل عن الأعراف الثقافية السعودية، أو مبادئ التمويل الإسلامي، أو أعراف المخاطبة الرسمية — وتحقّق من أن التأطير مناسب وليس صحيحاً نحوياً فقط.
  • اختبار توافق الجنس: اطلب من النموذج وصف طبيبة ومهندس، وتحقّق من توافق الجنس النحوي العربي الصحيح على الأفعال والصفات والضمائر.
  • معايرة الرسمية: اطلب خطاباً رسمياً ثم رسالة غير رسمية — النموذج الجيد يضبط المستوى اللغوي؛ والضعيف يستخدم النبرة نفسها للاثنين.
  • بدائل معيارية: استخدم AraLingBench (الاستدلال الصرفي والنحوي) وAraDiCE (الوعي الثقافي واللهجة) كنقاط مرجعية منشورة عند المقارنة بين النماذج.
  • علامات تحذيرية: الردود بالأحرف اللاتينية على موجّهات عربية، أو المستوى اللهجي الخاطئ، أو التأطير غير المناسب ثقافياً للمواضيع الدينية، كلها تشير إلى ملاءمة ضعيفة.
  • قاعدة عملية: لأي حالة استخدام عربية موجَّهة للعملاء، اختبر بما لا يقل عن 20 موجّهاً خاصاً بمجالك قبل النشر — درجات المعايير لا تلتقط محتواك المحدد.

الأسئلة الشائعة: نماذج LLM العربية المحلية

ما هو ALLaM ومن أنشأه؟

ALLaM عائلة من نماذج اللغة العربية بناها المركز الوطني للذكاء الاصطناعي (NCAI) في SDAIA بالشراكة مع IBM، ويُسوَّق الآن عبر HUMAIN، شركة ذكاء اصطناعي مملوكة لصندوق الاستثمارات العامة. النسخة 7B Instruct متاحة علناً برخصة Apache 2.0؛ وتوجد نسخ أكبر 13B و34B و70B، لكن النسخة 7B وحدها لها أوزان مفتوحة.

هل يمكنني تشغيل ALLaM محلياً؟

نعم — للنموذج ALLaM 7B Instruct تكميمات GGUF على Hugging Face تعمل مباشرة في Ollama وllama.cpp على وحدة GPU بنحو 8 GB من VRAM أو Apple Silicon بذاكرة موحَّدة 16 GB. والنسخة 34B التي تشغّل HUMAIN Chat مملوكة حصرياً ولا يمكن استضافتها ذاتياً.

ما هو AceGPT وهل لا يزال مُصاناً؟

AceGPT نموذج عربي طوّرته بالاشتراك KAUST وCUHKSZ وSRIBD، بنسخ 7B و13B برخصة Apache 2.0. تفوق على Jais عند إطلاقه عام 2023، لكن آخر تحديث له على GitHub كان في ديسمبر 2023، فيبدو غير مُصان — قابل للاستخدام لكنه غير مُحسَّن بنشاط.

كيف يقارَن ALLaM بـ Qwen في العربية؟

في AraLingBench، يسجّل ALLaM-7B درجة 72–74% مقابل 40–62% لنسخ Qwen — فجوة 12–32 نقطة مئوية في المهام اللغوية العربية. لدى Qwen منظومة أكبر وتغطية متعددة اللغات أوسع، لكن ALLaM أقوى في الصرف والنحو والمهام الثقافية الخاصة بالعربية.

لماذا تواجه النماذج متعددة اللغات صعوبة مع العربية؟

تكون عادةً طليقة نحوياً لكنها ضعيفة ثقافياً ولهجياً. قد تنخفض دقة اللهجة الصارمة إلى 0.016–0.078 للنماذج الأصغر، وضبط نموذج متعدد اللغات على العربية غالباً ما يحسّن جودة الفصحى بينما يقلّل دقة اللهجة — مفارقة موثَّقة. كما تُدخل بيانات التدريب المتمحورة غربياً تحيزات ثقافية في كيفية تعامل النماذج مع السياق الإسلامي والاجتماعي.

ما VRAM الذي أحتاجه لنموذج عربي 7B؟

نحو 6–8 GB من VRAM بتكميم Q4_K_M، مع التوصية بـ 8 GB أو أكثر لأداء مريح. يحتاج نموذج 13B إلى 10–14 GB، و34B نحو 20–24 GB، و70B نحو 40–48 GB.

هل Jais نموذج سعودي؟

لا — Jais إماراتي المنشأ، طوّرته Core42/G42 في أبوظبي، وليس مؤسسة سعودية. أُدرج هنا لأنه نموذج عربي قدير برخصة Apache 2.0 منافس في مهام اللهجة، لكنه ليس جزءاً من سلالة ALLaM/AceGPT السعودية.

هل أستخدم ALLaM 34B أم 7B؟

للنشر المحلي، استخدم النسخة 7B — فالنسخة 34B مملوكة حصرياً وغير قابلة للاستضافة الذاتية. ابدأ بـ ALLaM 7B على أجهزتك الخاصة، وإذا احتجت قدرة النسخة 34B فاصل إليها عبر منتج HUMAIN Chat بدلاً من توقّع أوزان قابلة للتنزيل.

كيف أختبر ما إذا كان النموذج يتعامل مع العربية السعودية بشكل صحيح؟

شغّل موجّهات اتساق الفصحى مقابل اللهجة، واسأل عن الأعراف الثقافية السعودية والتمويل الإسلامي، واختبر توافق الجنس النحوي (مثلاً وصف طبيبة ومهندس). راقب الردود بالأحرف اللاتينية، أو المستوى اللهجي الخاطئ، أو التأطير غير المناسب ثقافياً، وتحقّق بما لا يقل عن 20 موجّهاً خاصاً بمجالك قبل النشر.

ما هو HUMAIN؟

HUMAIN شركة ذكاء اصطناعي سعودية مملوكة بالكامل لصندوق الاستثمارات العامة، أُطلقت في مايو 2025. تُسوّق ALLaM وتشغّل HUMAIN Chat. وهي كيان منفصل عن SDAIA لكنها ورثت نماذج ALLaM من المركز الوطني للذكاء الاصطناعي التابع لـ SDAIA؛ ولاحقاً حصلت Aramco على حصة أقلية.

المصادر

  • Hugging Face — humain-ai/ALLaM-7B-Instruct-preview (بطاقة النموذج، تكميمات GGUF) — huggingface.co
  • AraLingBench — المعيار اللغوي العربي (arXiv 2511.14295) — arxiv.org
  • Landscape of Arabic LLMs — مسح (arXiv 2506.01340) — arxiv.org
  • AraDiCE — تقييم اللهجة والثقافة العربية، COLING 2025 (arXiv 2409.11404) — arxiv.org
  • إطلاق HUMAIN Chat على ALLaM 34B — Middle East AI News — middleeastainews.com
  • مجلس الوزراء السعودي — إعلان 2026 عاماً للذكاء الاصطناعي — spa.gov.sa

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider’s official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Run PromptQuorum with a local LLM, your own API keys, or both — you pick the backend.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

ALLaM وAceGPT: أفضل نماذج LLM عربية محلية 2026