حقائق سريعة
- 1صاغه: Wei وآخرون (2022)، Google Brain — الورقة التأسيسية في NeurIPS 2022
- 2النتيجة الرئيسية: رفع CoT بدون أمثلة دقة PaLM 540B من 17.7% إلى 78.7% في MultiArith
- 3عبارة التفعيل: "دعنا نفكِّر خطوةً بخطوة" (بدون أمثلة) أو أمثلة محلولة (مع أمثلة)
- 4التطور في 2026: أوضاع الاستدلال المُدمَجة (o3 والتفكير الممتد لـ Claude) تُؤتمت CoT داخليًا
- 5أثر التكلفة: CoT على مستوى التعليمات = رموز مخرجات أكثر؛ أوضاع الاستدلال = ميزانية رموز تفكير منفصلة
- 6أفضل النماذج لـ CoT على مستوى التعليمات: النماذج غير المزوَّدة بالاستدلال (Claude Haiku 4.5 وGemini Flash وGPT-5.5 mini وLLaMA 4 Scout)
ما هو توجيه سلسلة الأفكار
توجيه سلسلة الأفكار يطلب من النموذج الاستدلال خطوةً بخطوة قبل الوصول إلى استنتاج نهائي. بدلًا من إرجاع "الإجابة" فحسب، يكتب النموذج حسابات وسيطة وخطوات منطقية وشروحات.
يمكنك تفعيل هذا السلوك بتعليمات مثل "فكِّر خطوةً بخطوة" أو "أظهر استدلالك" أو بتقديم أمثلة محلولة يكون فيها الاستدلال صريحًا. النتيجة أثر يمكنك قراءته لفهم كيف توصَّل النموذج إلى استنتاجه.
لماذا يهم توجيه سلسلة الأفكار
توجيه سلسلة الأفكار مهم لأنه يجعل سلوك النموذج أكثر شفافيةً في المهام التي تنطوي على استدلال متعدد الخطوات. حين ترى كل خطوة، يمكنك اكتشاف سوء الفهم والافتراضات المفقودة والأخطاء الحسابية.
هذا قيِّم بشكل خاص في مجالات مثل التحليل والتخطيط وحل المشكلات. بدلًا من مخرجات معتمة، تحصل على رواية يمكنك التحقق منها أو تصحيحها أو إعادة استخدامها كوثائق.
🔍 يعمل مع النماذج المحلية
سلسلة الأفكار تعمل في أي نموذج بمعاملات 7B+. جرِّبه محليًا مع Ollama أو LM Studio.
متى يُساعد سلسلة الأفكار (ومتى لا)
توجيه سلسلة الأفكار يُساعد أكثر في المهام التي تنقسم طبيعيًا إلى خطوات واضحة، لكنه ليس ضروريًا لكل تعليمة. يتألق حين يكون المسار بأهمية الوجهة.
استدلال سلسلة الأفكار هو ما يُجعِل وكيلًا باستدعاءات أدوات موثوقًا في مهام متعددة الخطوات. لمكدس وكلاء محلي مع MCP، راجع وكلاء الذكاء الاصطناعي المحلية مع MCP.
حالات الاستخدام الجيدة تشمل:
- مسائل الرياضيات والاستدلال الكمي.
- الألغاز المنطقية متعددة الخطوات أو تحليل القرارات.
- تحليل السبب الجذري ومراجعات ما بعد الحوادث ومناقشات المقايضات.
- مهام التخطيط حيث يجب أن تكون تسلسل الإجراءات صريحًا.
للتصنيف البسيط والكتابة السريعة والإجابات الواقعية القصيرة، كثيرًا ما تُضيف سلسلة الأفكار إسهابًا بدون قيمة إضافية تُذكر. في المجالات الحساسة، قد ترغب أيضًا في إبقاء الاستدلال داخليًا وإظهار الإجابة النهائية فقط للمستخدمين.
مثال: بدون سلسلة الأفكار ومعها
الفرق يتضح حين تقارن تعليمة إجابة مباشرة بأخرى تطلب الاستدلال صراحةً. إليك مثال قرار بسيط.
تعليمة ضعيفة
"ما المشروع الذي يجب أن نُعطيه الأولوية في الربع القادم؟"
تعليمة مُحسَّنة
"أنت مدير عمليات منتج. لدينا ثلاثة مشاريع مرشَّحة للربع القادم. استخدم استدلال سلسلة الأفكار لتقرير أي مشروع تُعطيه الأولوية. 1) اسرد معايير القرار التي ستستخدمها (مثل تأثير الإيرادات والمخاطر والتوافق مع الاستراتيجية). 2) قيِّم كل مشروع مقابل هذه المعايير خطوةً بخطوة. 3) قدِّم توصية واضحة وبرِّرها في 3-5 جمل. في النهاية، قدِّم إجابةً نهائية قصيرة تبدأ بـ `التوصية:` في سطر منفصل."
في النسخة "المُحسَّنة"، يشرح النموذج كيف اختار معاييره وكيف يُقيِّم كل مشروع ثم يُصدِر توصيةً يمكنك التشكيك فيها أو قبولها.
كيفية كتابة تعليمات سلسلة الأفكار الفعَّالة
لكتابة تعليمات سلسلة أفكار فعَّالة، يجب تحديد بنية الاستدلال وبنية الإجابة النهائية. الطلبات المبهمة مثل "اشرح أكثر" أقل موثوقية من التعليمات المحددة.
نمط عملي هو:
- أخبر النموذج بدوره (مثلًا "أنت محلل بيانات كبير.").
- حدِّد أنه يجب أن يفكر خطوةً بخطوة أو يستخدم سلسلة الأفكار.
- عرِّف أقسام الاستدلال التي تتوقعها (مثلًا افتراضات وحسابات ومقارنة واستنتاج).
- اطلب إجابةً نهائية قصيرة ومحدَّدة بوضوح في النهاية حتى تتمكن من استخدامها بسرعة.
هذا يفصل الاستدلال التفصيلي عن المخرجات الموجزة، وهو مفيد حين تُدمِج النتائج في أدوات أو تقارير أخرى.
توجيه سلسلة الأفكار في PromptQuorum
PromptQuorum أداة إرسال ذكاء اصطناعي متعدد النماذج حيث يمكنك تطبيق توجيه سلسلة الأفكار باتساق عبر نماذج مختلفة. تكتب تعليمةً منظَّمة لسلسلة الأفكار وترسلها إلى عدة مزودين بالتوازي.
في PromptQuorum يمكنك:
- الجمع بين تعليمات سلسلة الأفكار وأُطر موجَّهة نحو الاستدلال مثل TRACE أو APE لضمان تسمية خطوات التفكير صراحةً.
- مقارنة كيفية تعامل نماذج مختلفة مع نفس مهمة الاستدلال وفحص آثار خطواتها جنبًا إلى جنب.
- حفظ تعليمات سلسلة الأفكار كقوالب للتحليلات المتكررة ومراجعات الحوادث أو القرارات الاستراتيجية.
هذا يُحوِّل توجيه سلسلة الأفكار من حيلة عرضية إلى جزء قابل للتكرار من عملية اتخاذ القرار.
كيفية استخدام CoT
- 1في مهام المنطق والاستدلال أو التصحيح، اطلب من النموذج "التفكير خطوةً بخطوة" قبل الإجابة. بدلًا من "ما الخطأ؟" اسأل "تتبَّع التنفيذ خطوةً بخطوة، ثم حدِّد الخطأ."
- 2قدِّم مثالًا محلولًا يُظهر الاستدلال خطوةً بخطوة. لا تصفه فحسب — أظهر للنموذج كيف يبدو الاستدلال خطوةً بخطوة. مثال: "أولًا، أراجع توقيع الدالة... ثم أتتبَّع الاستدعاء الأول بالمدخلات X..."
- 3استخدم تعليمات صريحة مثل "دعنا نفكِّر خطوةً بخطوة" أو "أولًا، حدِّد... ثم..." هذه تُفعِّل استدلالًا أكثر تأمُّلًا في النموذج.
- 4للمشكلات المعقدة، اطلب من النموذج تتبُّع المخرجات الوسيطة. مثال: "تتبَّع تنفيذ هذه الدالة بالمدخل 5. أظهر قيمة كل متغير بعد كل سطر."
- 5اجمع CoT مع مخرجات قابلة للتحقق: اطلب من النموذج إظهار عمله حتى تتمكن من مراجعته. "اشرح استدلالك في كل خطوة. إذا ارتكبت خطأً، يجب أن يكون مرئيًا في العمل الذي تُظهره."
مثال رياضي: حساب الإيرادات
بدون CoT، قد يُعطي النموذج إجابةً نهائية واحدة. مع CoT، يُظهر النموذج الحسابات خطوةً بخطوة.
بدون CoT:
"عميل يشتري 50 وحدة بسعر $15 لكل منها، لكن يحصل على خصم 10%. كم يدفع؟"
النموذج: "$675"
مع CoT:
"عميل يشتري 50 وحدة بسعر $15 لكل منها، لكن يحصل على خصم 10%. اعمل هذا خطوةً بخطوة: 1) احسب المجموع الفرعي. 2) احسب مبلغ الخصم. 3) اطرح الخصم من المجموع الفرعي للحصول على السعر النهائي."
النموذج: "1) المجموع الفرعي = 50 × $15 = $750. 2) الخصم = 10% من $750 = $75. 3) السعر النهائي = $750 − $75 = $675."
كلاهما يُعطيان نفس الإجابة، لكن نسخة CoT تُتيح رؤية الرياضيات واكتشاف الأخطاء (مثلًا إذا حسب أحدهم 10% من $750 بشكل خاطئ).
CoT مقابل نماذج الاستدلال المُدمَجة (2026)
في 2026، نماذج الحدود — Claude Opus 4.8 وOpenAI o3 وGemini Deep Think — تمتلك أوضاع استدلال مُدمَجة تُدخِل سلسلة الأفكار تلقائيًا. لست بحاجة إلى إضافة تعليمات "فكِّر خطوةً بخطوة" في هذه النماذج.
متى تستخدم CoT على مستوى التعليمات: النماذج غير المزوَّدة بالاستدلال (Claude Haiku 4.5 وGPT-5.5 mini وGemini Flash وLlama 4) أو LLMs المحلية أو حين تريد تجنُّب التكلفة الإضافية لميزانيات رموز الاستدلال.
متى تستخدم أوضاع الاستدلال المُدمَجة: أقصى دقة في نماذج الحدود والمهام الرياضية المكثَّفة والتحليل المعقَّد. هذه النماذج تُفوتر رموز الاستدلال بشكل منفصل (عادةً بتعريفة أعلى من رموز المخرجات). اختبر تعليمات CoT في وحدة تحكم Anthropic أو ملعب OpenAI قبل نشرها في الإنتاج.
| النهج | الأفضل لـ | التكلفة | الشفافية | النماذج |
|---|---|---|---|---|
| CoT على مستوى التعليمات ("فكِّر خطوةً بخطوة") | النماذج الصغيرة وLLMs المحلية والمهام الحساسة للتكلفة | يزيد رموز المخرجات | كاملة: الخطوات مرئية في المخرجات | Haiku وFlash وLLaMA وQwen |
| التفكير الممتد لـ Claude (Opus 4.8 وSonnet 4.6) | التحليل المعقَّد وأقصى دقة | ميزانية رموز تفكير منفصلة (تعريفة المدخلات) | أثر المفتش عبر API | Claude Opus 4.8 وClaude Sonnet 4.6 |
| OpenAI o3 | المشكلات الأصعب (رياضيات وكود ومسابقات) | ميزانية رموز الاستدلال (المستوى الأعلى) | الاستدلال مخفي والمخرجات مرئية | OpenAI o3 |
| Gemini Deep Think | التكامل مع Google Cloud ونظام Gemini البيئي | رموز التفكير منفصلة عن المخرجات | معامل thinking_level (LOW وMEDIUM وHIGH) | Gemini 3.1 Pro |
| DeepSeek R1 | خيار الأوزان المفتوحة والاستدلال على الجهاز | الاستدلال المرئي يُبثّ كنص مخرجات | كاملة: CoT مضمَّن في المخرجات | DeepSeek R1 |
💡 نصيحة احترافية
إذا كنت تبني مع مراعاة التكلفة، استخدم CoT على مستوى التعليمات في النماذج الأصغر. إذا كنت تبني للدقة في المشكلات الصعبة، استخدم o3 أو التفكير الممتد لـ Claude ودع النموذج يُدير الاستدلال داخليًا.
متغيرات وامتدادات سلسلة الأفكار
إلى جانب النمط الأساسي "فكِّر خطوةً بخطوة"، طوَّر الباحثون عدة متغيرات لـ CoT، كل منها مُحسَّن لأنواع مختلفة من المشكلات.
- CoT بدون أمثلة: اسأل "دعنا نفكِّر خطوةً بخطوة" بدون أمثلة. يعمل في معظم النماذج وهو الأبسط تطبيقًا. التحسين: ~10-20% في مهام الاستدلال.
- CoT مع أمثلة: أظهر 2-5 أمثلة محلولة يكون الاستدلال فيها صريحًا، ثم اطلب من النموذج تطبيق نفس النمط على مشكلة جديدة. أكثر موثوقية من النسخة بلا أمثلة لكن يتطلب إنشاء أمثلة يدويًا. التحسين: ~20-40% دقة.
- الاتساق الذاتي (Wang وآخرون، 2023): يولِّد مسارات استدلال CoT متعددة باستقلالية، ثم يأخذ التصويت الأغلبي في الإجابة النهائية. أكثر متانةً بكثير ضد الأخطاء. التحسين: ~30-50% في المهام الصعبة.
- شجرة الأفكار (ToT): بدلًا من سلسلة خطية، يستكشف فروع استدلال متعددة ويُقلِّم الضعيفة. استخدمه حين توجد مسارات حل محتملة عديدة (التخطيط والألعاب والمهام الإبداعية).
- ReAct (الاستدلال + التصرف): يتشابك الاستدلال مع الإجراءات الخارجية — استدعاء APIs والبحث في قواعد البيانات أو تنفيذ الكود — ويُدمِج النتائج في خطوة الاستدلال التالية. مثالي للمهام الواقعية التي تحتاج بيانات في الوقت الفعلي أو تحقق.
مقارنة النماذج: كيف تتعامل مع CoT (2026)
| النموذج | CoT على مستوى التعليمات | الاستدلال المُدمَج | أفضل حالة استخدام | التكلفة (تقريبًا) |
|---|---|---|---|---|
| Claude Opus 4.8 | غير ضروري | التفكير الممتد (أثر قابل للفحص عبر API) | تحليل أقصى دقة | أعلى (مدخلات + مخرجات + رموز التفكير) |
| Claude Sonnet 4.6 | غير ضروري | التفكير الممتد | توازن الدقة/التكلفة | متوسط |
| Claude Haiku 4.5 | مُوصى به | لا يوجد | استدلال سريع واقتصادي | منخفض |
| OpenAI o3 | غير ضروري | مستويات جهد (low وmedium وhigh وxhigh) | مشكلات مستوى المسابقات | مرتفع جدًا (مستوى رموز الاستدلال) |
| GPT-5.5 mini | مُوصى به | لا يوجد | نشر اقتصادي | منخفض جدًا |
| Gemini 3.1 Pro | يعمل | Deep Think (معامل thinking_level) | التكامل مع Google Cloud | متوسط-مرتفع |
| Gemini Flash | مُوصى به | لا يوجد | استجابات سريعة | منخفض |
| DeepSeek R1 | غير ضروري | الاستدلال المضمَّن في المخرجات | أوزان مفتوحة وعلى الجهاز | مجاني (مفتوح المصدر) |
| Llama 4 | مُوصى به | لا يوجد | نشر محلي وخصوصية | استضافة ذاتية (يعتمد على الحوسبة) |
قراءة ذات صلة
الأسئلة الشائعة
هل تعمل سلسلة الأفكار في جميع النماذج؟
تعمل سلسلة الأفكار في معظم النماذج بمعاملات 7B+، لكن الفائدة تتفاوت. الأكثر فعاليةً في النماذج المتوسطة والصغيرة (Haiku وFlash وLlama 4). في نماذج الحدود (Claude Opus 4.8 وo3)، أوضاع الاستدلال المُدمَجة عادةً أكثر كفاءةً من CoT على مستوى التعليمات.
هل تزيد سلسلة الأفكار التكلفة؟
نعم، CoT على مستوى التعليمات يزيد عدد رموز المخرجات (لأن النموذج يكتب الاستدلال قبل الإجابة النهائية). أوضاع الاستدلال المُدمَجة (التفكير الممتد لـ Claude وOpenAI o3) تستخدم ميزانيات رموز تفكير منفصلة بتعريفات فواتير مختلفة. اختبر كليهما في حالة استخدامك لمقارنة مقايضة التكلفة/الدقة.
متى يجب استخدام CoT مع أمثلة بدلًا من بلا أمثلة؟
ابدأ بـ CoT بلا أمثلة أولًا — أبسط ويعمل في معظم الحالات. انتقل إلى الأمثلة (مع 2-5 أمثلة) إذا كان بلا أمثلة غير موثوق أو إذا كان مجالك يتطلب أنماط استدلال محددة (مثلًا التحليل المالي ببنية سطر قياسية).
هل يمكنني الجمع بين سلسلة الأفكار والمخرجات المنظَّمة (JSON)؟
نعم. يمكنك طلب إظهار النموذج استدلاله بنص عادي أولًا، ثم إنتاج كائن JSON بالإجابة النهائية. اجمع التعليمات: "فكِّر خطوةً بخطوة. ثم قدِّم نتيجتك كـ JSON صالح." هذا شائع في أنظمة الإنتاج.
ما الفرق بين سلسلة الأفكار وشجرة الأفكار؟
سلسلة الأفكار تسلسل خطي: خطوة 1 → خطوة 2 → ... → استنتاج. شجرة الأفكار تستكشف فروعًا متعددة (مسارات استدلال بديلة) وتُقلِّم الأضعف قبل الوصول إلى الإجابة. شجرة الأفكار أكثر قوةً لكن أكثر تكلفةً (تتطلب استدعاءات نموذج متعددة).
هل يتطلب OpenAI o3 توجيه سلسلة الأفكار؟
لا. OpenAI o3 يمتلك استدلالًا مُدمَجًا يُفعَّل تلقائيًا. لست بحاجة إلى إضافة تعليمات "فكِّر خطوةً بخطوة". فقط أعطِه المشكلة وحدِّد مستوى الجهد (low/medium/high/xhigh) للتحكم في حجم ميزانية الاستدلال المُنفَق.
هل يمكنني تدقيق استدلال نماذج الاستدلال المُدمَجة؟
نعم، لكن يعتمد على النموذج. آثار التفكير الممتد لـ Claude قابلة للفحص عبر API. استدلال OpenAI o3 مخفي افتراضيًا (لأسباب تنافسية). استدلال Gemini Deep Think مخفي أيضًا. للتدقيق الكامل، استخدم CoT على مستوى التعليمات أو DeepSeek R1.
هل توجيه سلسلة الأفكار مناسب لتطبيقات الوقت الفعلي؟
CoT على مستوى التعليمات يُضيف زمن استجابة (رموز مخرجات أكثر = توليد أبطأ). لحالات الاستخدام في الوقت الفعلي، استخدم نماذج أصغر باستدلال أدنى حدًا، أو استخدم نقاط نهاية البث لإظهار الرموز أثناء وصولها. أوضاع الاستدلال المُدمَجة يمكن أن تُضيف زمن استجابة أكثر؛ قِس أداء حالة استخدامك المحددة.
المصادر والقراءات الإضافية
- Wei, J., Wang, X., Schuurmans, D., وآخرون (2022). "Chain-of-Thought Prompting Elicits Reasoning in Large Language Models." NeurIPS 2022. arXiv:2201.11903
- Kojima, T., Gu, S. S., Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). "Large Language Models are Zero-Shot Reasoners." NeurIPS 2022. arXiv:2205.11916
- Wang, X., Wei, J., Schuurmans, D., وآخرون (2023). "Self-Consistency Improves Chain of Thought Reasoning in Language Models." ICLR 2023. arXiv:2203.11171
- Anthropic. (2024). "Extended Thinking in Claude." الوثائق التقنية حول قدرات الاستدلال في Claude Opus 4.8 وSonnet 4.6.
- OpenAI. (2026). "OpenAI o3: Reasoning Models for Competition-Level Problem Solving." وثائق وأبحاث OpenAI.