ما هي هلوسات الذكاء الاصطناعي؟
الـهلوسة في الذكاء الاصطناعي هي بيان مغلوط أو ملفق تولِّده نموذج اللغة الكبير بثقة ظاهرة. يُنتج النموذج نصًا يخالف الواقع — أسماء خاطئة، ومصادر مخترعة، وتواريخ مستحيلة، وعناوين URL وهمية — مستخدمًا الأسلوب الطلق ذاته الذي يُستخدم للمعلومات الدقيقة.
يختلف هذا اختلافًا جوهريًا عن نموذج يُعبِّر عن عدم اليقين. تتميز الهلوسات بتأكيدات واثقة ومفصَّلة حول أشياء غير موجودة أو أحداث لم تقع. قد يستشهد النموذج بمقال نُشر في مجلة غير موجودة، أو يخترع تفاصيل سيرة ذاتية، أو يذكر تاريخًا تاريخيًا خاطئًا بفارق قرون، أو يصف ميزة منتج لم تُبنَ قط.
في جملة واحدة: الهلوسات هي تصريحات كاذبة وسلسة تولِّدها نماذج اللغة لأنها تتنبأ بأنماط النصوص بدلًا من استرجاع الحقائق من مخزن موثوق.
لماذا تهلوس نماذج اللغة
تعمل النماذج اللغوية الكبيرة عبر التنبؤ بالكلمة التالية في تسلسل. لا تستشير قاعدة بيانات ولا تتحقق من الحقائق مقابل المصدر الأصلي. تحسب الاحتمالات بناءً على الأنماط في بيانات التدريب. يُفضي هذا التصميم الجوهري — الفعَّال جدًا في مهام اللغة — بطبيعته إلى ضغط نحو الهلوسة.
الآليات الجوهرية
- التنبؤ بالرمز التالي، لا استرجاع الحقائق. معمارية النموذج مُحسَّنة لتوليد اللغة، لا للتحقق من الحقائق. حين يطرح تعليمة سؤالًا، يكون هدف النموذج إنتاج استمرارية متماسكة ومعقولة للنص. التماسك والصحة ليسا الشيء ذاته.
- ثغرات بيانات التدريب وانتهاء صلاحيتها. تُدرَّب النماذج على بيانات ذات تاريخ نهائي محدد. تُفرز ثغرات المعلومات فراغات. حين يُسأل عن هذه الثغرات، يفتقر النموذج إلى أنماط صادقة ليتنبأ منها. يخترع تفاصيل تبدو معقولة بدلًا من قول "لا أملك هذه المعلومات".
- لا آلية ثقة صريحة. لا تولِّد النماذج درجة ثقة مرفقة بكل مخرج. تُنتج نصًا دون إشارة داخلية تقول "أنا متيقن بنسبة ٣٠٪ من هذا الادعاء."
- ضغط التعليمات التي تطالب بإجابات. تعليمات مثل "اشرح كل شيء عن الموضوع" تُوصل ضمنيًا: يجب أن تُجيب، حتى لو لم تكن متأكدًا. يستجيب النموذج باختراع تفاصيل لإرضاء الطلب.
- نافذة سياق محدودة وفقدان المعلومات. لا تستطيع النماذج اللغوية الكبيرة الاحتفاظ إلا بكمية محدودة من السياق في الذاكرة. تجعل المستندات أو المحادثات الطويلة التفاصيل السابقة تتلاشى.
- الاختلاق في الاستدلال متعدد الخطوات. في المسائل التي تتطلب خطوات استدلال متعددة، قد يفقد النموذج خيط النتائج الوسيطة ويخترع خطوة داعمة لتبرير استنتاج.
الأنواع الشائعة للهلوسات
تتبع الهلوسات أنماطًا يمكن التعرف عليها. يساعدك تحديد النوع على اختيار استراتيجيات تخفيف محددة.
| النوع | مثال | سبب الحدوث | الخطورة |
|---|---|---|---|
| مصادر مخترعة | الاستشهاد بمجلة أكاديمية غير موجودة؛ أسماء مؤلفين وسنوات نشر مخترعة | دُرِّب النموذج على ملايين الاستشهادات وتعلَّم أنماطًا تشبه الاستشهادات، ثم يخترع استشهادات جديدة | عالية جدًا |
| حقائق غير صحيحة (تواريخ وأرقام وأسماء) | ذكر حدث تاريخي في العام الخطأ؛ تفاصيل سيرة ذاتية مغلوطة | بيانات التدريب غير مكتملة أو متناقضة؛ يختار النموذج رقمًا يبدو معقولًا | عالية جدًا |
| عناوين URL وبريد إلكتروني وهمية | تقديم رابط أو عنوان بريد إلكتروني لا يعمل أو لا ينتمي للمنظمة المزعومة | تعلَّم النموذج أنماط URL والبريد الإلكتروني ويولِّد أنماطًا جديدة واقعية لكنها خيالية | عالية |
| فقدان السياق | الإجابة على سؤال كأن النموذج فهم السياق السابق، لكنه في الواقع فقد الخيط | نافذة السياق محدودة؛ المستندات الطويلة تجعل التفاصيل السابقة تتلاشى من انتباه النموذج | عالية |
| تحول الدور | البدء بدور (محلل) والتحول تدريجيًا إلى دور آخر (راوٍ)، مع اختراع تفاصيل لملء الفراغات | يفقد النموذج خيط التعليمة الأصلية ويعود إلى مطابقة الأنماط البحتة | متوسطة |
| تعميم مفرط الثقة | القول "كل X يفعل Y" بينما تُظهره فقط أمثلة التدريب المحددة | يُعمِّم النموذج بشكل أوسع من اللازم من بيانات تدريب محدودة دون التحقق من الثقة | متوسطة |
| تناقض داخلي | تقديم ادعاءات متناقضة ضمن الإجابة ذاتها | لا يملك النموذج آلية لتتبع الاتساق عبر جمل متعددة | متوسطة |
الأنواع السبعة للهلوسات هي: مصادر مخترعة، وحقائق غير صحيحة، وعناوين URL وبريد إلكتروني وهمية، وفقدان السياق، وتحول الدور، وتعميم مفرط الثقة، وتناقضات داخلية.
كيف يؤثر تصميم التعليمات على خطر الهلوسة
تعليماتك تُشجِّع الهلوسات أو تُثبِّطها. الفرق قابل للقياس.
التعليمات التي تزيد من خطر الهلوسة:
- "أخبرني كل شيء عن الموضوع" — بلا حدود، بلا إذن بقول "لا أعرف"
- "تأكد من تضمين تفاصيل كثيرة" — ضغط صريح لملء الفراغ بمعلومات مخترعة
- "اكتب كما لو كنت خبيرًا رائدًا" — يُشجِّع الادعاءات الواثقة، حتى في المطالبات غير المؤكدة
- "أجب حتى لو لم تكن متأكدًا تمامًا" — يُزيل الكابح على الهلوسات
التعليمات التي تُقلِّل من خطر الهلوسة:
- "يمكنك قول 'لا أعرف' إذا لم تكن متأكدًا" — إذن صريح للاعتراف بثغرات المعرفة
- "استخدم فقط المعلومات الواردة في السياق أدناه" — يُقيِّد الإجابة بالبيانات المقدَّمة، لا المعرفة المخترعة
- "ميِّز بين الحقائق والآراء. ضع علامة على الادعاءات غير المؤكدة بـ غير مؤكد" — يُجبر النموذج على التمييز
- "استشهد بمصدرك لكل ادعاء واقعي" — يجعل الاستشهادات المخترعة واضحة للعيان
- "إذا لم تستطع التحقق من هذا الادعاء، لا تُدرِجه" — قيد صريح على الادعاءات غير المحققة
هيكل التعليمة الجيد
تجمع التعليمات الجيدة أربعة عناصر: دور أو سياق واضح (ما الإطار الذي يجب أن يتبناه النموذج؟)، ومهمة محددة (ما المخرج الذي أحتاجه؟)، وبيانات إدخال حقيقية (ما المعلومات المقدَّمة؟)، وقيود صريحة (ما الذي لا يستطيع النموذج فعله؟). يُقلِّل هذا الهيكل من ضغط الهلوسة بإزالة الغموض حول ما يجب على النموذج فعله.
تقنيات الحد من الهلوسات
ثلاثة مناهج تكاملية تُقلِّل الهلوسات: - على مستوى التعليمة: أضف قيودًا وإذنًا للاعتراف بعدم اليقين في تعليماتك - على مستوى النظام: استخدم RAG أو استدعاء الدوال أو الاسترجاع لتأسيس الإجابات على بيانات حقيقية - على مستوى النموذج: شغِّل التعليمة ذاتها على نماذج مستقلة متعددة للكشف عن الهلوسات عبر التوافق
١. إذن صريح بقول "لا أعرف"
أخبر النموذج: "إذا لم تكن متأكدًا أو لا تملك المعلومات، فقل ذلك. لا تخمِّن."
هذا يُزيل الضغط لاختراع إجابات. كثير من النماذج مُدرَّبة على أن تكون مفيدة وستُحاول الإجابة حتى حين تكون غير متأكدة تمامًا. تحريرها صراحةً من هذا التوقع يُعطيها إذنًا بالرفض.
٢. طلب المصادر أو الأدلة
اشترط: "استشهد بمصدر كل ادعاء واقعي" أو "قدِّم URL وتاريخ النشر لكل مرجع."
هذا يُجعل الاستشهادات المخترعة واضحة (لا تعمل أو تُشير إلى مصادر غير موجودة) ويُجبر النموذج على التحلي بمزيد من الحذر عند ادعاء الحقائق.
٣. النقد الذاتي والتحقق من التناقضات
اطلب من النموذج مراجعة مخرجه:
> "بعد اكتمال إجابتك، راجعها بحثًا عن تناقضات أو ادعاءات تتعارض مع شيء قلته سابقًا. أشر إلى أي تناسق تجده."
كثيرًا ما تكتشف النماذج أخطاءها الخاصة حين يُطلب منها التأمل.
٤. استخدام التعليمات السلبية
حدِّد صراحةً ما لا يستطيع النموذج فعله:
- "لا تخترع مصادر أو عناوين URL أو أسماء مؤلفين تحت أي ظرف"
- "لا تخمِّن التواريخ إذا لم تكن متأكدًا — اترك التاريخ فارغًا بدلًا من التخمين"
- "لا تُضف معلومات غير واردة في السياق المقدَّم"
- "تعليمة سلبية:" "لا تُضف معلومات غير واردة في الجدول الزمني" تعليمة صريحة
- "إذن بالحذف:" "إذا لم تكن متأكدًا، اتركه" يُزيل الضغط لاختراع التفاصيل
- "مسؤولية المصادر:" كل ادعاء يتطلب الاستشهاد بالمرجع
أسئلة شائعة
هل يمكن القضاء على الهلوسات كليًا؟
لا. الهلوسات متأصِّلة في آلية عمل نماذج اللغة — فهي تتنبأ بأنماط النصوص بدلًا من استرجاع الحقائق من مخزن محقَّق. يمكنك تقليلها بشكل ملحوظ بفضل تصميم جيد للتعليمات وأدوات مثل RAG والتوافق متعدد النماذج، لكن الاستئصال الكامل غير ممكن مع بنية النماذج اللغوية الكبيرة الحالية. تظل المراجعة البشرية ضرورية للقرارات عالية المخاطر.
لماذا يبدو النموذج واثقًا حين يكون مخطئًا؟
نماذج اللغة مُدرَّبة على توليد نص سلس ومتماسك. الثقة نتاج ثانوي للتماسك اللغوي. يمكن أن يكون الادعاء الكاذب أكثر تماسكًا وصياغةً من اعتراف صادق بعدم اليقين.
هل النماذج الأحدث والأكبر تهلوس أقل؟
النماذج الأكبر تهلوس أحيانًا أكثر في بعض المهام لأنها أفضل في توليد نص يبدو معقولًا، مما يجعل الادعاءات الكاذبة أصعب اكتشافًا. تُحقِّق النماذج الأحدث أداءً واقعيًا أفضل في بعض المهام. تعتمد العلاقة بين حجم النموذج والهلوسة على المهمة.
هل يُزيل توصيل نموذج بالإنترنت الهلوسات؟
جزئيًا. الوصول إلى الويب في الوقت الحقيقي يساعد في الأحداث الجارية والحقائق الأحدث، لكنه لا يحل المشكلة الجوهرية: النموذج لا يزال يخترع تفاصيل أو يُسيء تفسير نتائج البحث أو يهلوس عن محتوى لم يسترجعه فعليًا.
كيف يمكنني التحقق بسرعة مما إذا كانت الإجابة قد هلوست؟
تحقق من المصادر: انقر على عناوين URL أو ابحث عن المقالات المستشهد بها. إذا لم تكن موجودة، فالإجابة هلوست. تحقق من الحقائق: تحقق من البيانات والأسماء والأرقام مع مصادر موثوقة. قارن نماذج متعددة: اطرح السؤال ذاته على نماذج مختلفة. الاختلاف الشديد يُشير إلى أن واحدًا على الأقل قد هلوس.
هل يجب أن أتوقف عن استخدام الذكاء الاصطناعي إذا كان يهلوس؟
لا. استخدم الذكاء الاصطناعي بشكل استراتيجي مع التحقق. للعصف الذهني والمسودات والعمل الاستكشافي، الهلوسات إزعاج بسيط. للعمل المعتمد على الحقائق (البحث والامتثال والقرارات الطبية والمشورة المالية)، استخدم الذكاء الاصطناعي كنقطة انطلاق، ثم تحقق من كل شيء مع مصادر موثوقة أو مراجعة متخصصة.
ما الفرق بين الهلوسة والخطأ الحقيقي؟
الهلوسة واثقة وكاذبة. إذا قال نموذج "لست متأكدًا، لكن قد يكون X"، فهذا عدم يقين صادق، لا هلوسة. إذا قال "عاصمة فرنسا هي برلين" بكل ثقة، فهذه هلوسة — قال النموذج شيئًا كاذبًا كأنه حقيقة. العلامة هي التأكيد الواثق لشيء غير صحيح.
مواد ذات صلة
- ما هي هندسة التعليمات؟ — المفاهيم الأساسية وراء هيكلة التعليمات
- تقنيات النقد الذاتي في التعليمات — كيفية جعل النماذج تكتشف أخطاءها الخاصة
المصادر
- Wei, J., Wang, X., Schuurmans, D., et al. (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." ArXiv — الورقة التأسيسية التي تُظهر أن الاستدلال خطوة بخطوة يُقلِّل الهلوسات في مهام الرياضيات والمنطق.
- Maynez, J., Narayan, S., Hashimoto, B., & Hardt, D. (2021). "On Faithfulness and Factuality in Abstractive Summarization." ACL Proceedings — دراسة تجريبية لمعدلات وآليات الهلوسة في توليد النص العصبي.
- Anthropic (2024). "Constitutional AI." https://www.anthropic.com/constitutional-ai — نهج Anthropic لتقليل المخرجات الضارة والهلوسات عبر التدريب القائم على المبادئ.