أفضل نموذج ⁨DeepSeek⁩ مقطّر لكرت الشاشة لديك (⁨2026⁩)

اقرأ بـ:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

تحتوي هذه الصفحة على روابط مرجعية لمنتجات طرف ثالث. لا يشارك PromptQuorum في أي برنامج تابع — هذه روابط عادية لا تدر أي عمولة. النقر على الروابط والخطوات التالية تقع على عاتقك بالكامل. لا تمثل هذه الروابط أي تأييد أو تحقق من قِبَل PromptQuorum.

إجابة سريعة

حدّد كرتك: RTX 3060 12GB → 7B، وRTX 4060 Ti 16GB → 14B، وRTX 4070/4080 → 14B أو 32B، وRTX 4090 → 32B، وكرتان/48 GB → 70B. لأفضل نموذج صغير على 8 GB، شغّل DeepSeek-R1-0528-Qwen3-8B. كل نموذج يعمل بأمر Ollama واحد بصيغة Q4_K_M.

▸RTX 3060 12GB → deepseek-r1:7b — ~30–40 tok/s
▸RTX 4060 Ti 16GB → deepseek-r1:14b — ~25–35 tok/s (موصى به)
▸RTX 4070 / 4080 → deepseek-r1:14b أو :32b — 14B ~40–50، 32B ~15–20 tok/s
▸RTX 4090 24GB → deepseek-r1:32b — ~30–40 tok/s، يتفوق على o1-mini
▸كرتان / 48 GB → deepseek-r1:70b — ~12–18 tok/s
▸كرت 8 GB، أفضل نموذج صغير → DeepSeek-R1-0528-Qwen3-8B

تحديث: 2026-06-19

Quantization & VRAMمتوسط

النقاط الرئيسية

✓RTX 3060 12GB → نموذج 7B مقطّر؛ RTX 4060 Ti 16GB → 14B (الخيار الأمثل)؛ RTX 4090 → 32B (يتفوق على o1-mini).
✓كرتان أو 48 GB → نموذج 70B مقطّر، وهو الأقوى من بين الستة.
✓على 8 GB، أفضل نموذج صغير هو DeepSeek-R1-0528-Qwen3-8B.
✓كل نموذج يُثبَّت بصيغة Q4_K_M بأمر واحد، مثل `ollama run deepseek-r1:14b`.
✓اضبط درجة الحرارة على 0.6 ولا تستخدم system prompt لتجنّب أعطال التكرار في R1.
✓هذه عائلة R1 الاستدلالية — وليست DeepSeek-V3 وهو نموذج محادثة.

كرت الشاشة → نموذج DeepSeek-R1 مقطّر → أمر Ollama

حدّد كرت الشاشة الذي تمتلكه في العمود الأول واقرأ عبر الصف. أرقام tok/s تقريبية لأحمال الاستدلال بصيغة Q4_K_M وتتغير حسب طول السياق وإعدادات أخذ العينات. عندما يتسع نموذجان، فالأكبر يستدل بشكل أفضل والأصغر أسرع.

GPU (VRAM)	أفضل نموذج مقطّر	أمر Ollama	tok/s المتوقع
RTX 3060 12GB (فئة 8 GB)	DeepSeek-R1-Distill-Qwen-7B	ollama run deepseek-r1:7b	~30–40
8 GB، أفضل صغير	DeepSeek-R1-0528-Qwen3-8B	ollama run deepseek-r1-0528-qwen3:8b	~30–40
RTX 4060 Ti 16GB	DeepSeek-R1-Distill-Qwen-14B	ollama run deepseek-r1:14b	~25–35
RTX 4070 / 4080	14B (سريع) أو 32B (إذا 16 GB+)	ollama run deepseek-r1:14b	14B ~40–50
RTX 4090 24GB	DeepSeek-R1-Distill-Qwen-32B	ollama run deepseek-r1:32b	~30–40
كرتان / 48 GB	DeepSeek-R1-Distill-Llama-70B	ollama run deepseek-r1:70b	~12–18

RTX 3060 12GB على Amazon (رابط منتج · مُفصح عنه)رابط منتج · مُفصح عنهRTX 4060 Ti 16GB على Amazon (رابط منتج · مُفصح عنه)رابط منتج · مُفصح عنهRTX 4070 على Amazon (رابط منتج · مُفصح عنه)رابط منتج · مُفصح عنهRTX 4090 24GB على Amazon (رابط منتج · مُفصح عنه)رابط منتج · مُفصح عنه

كيفية استخدام هذا الجدول في 3 خطوات

ثلاثة أسطر: (1) حدّد كرت الشاشة لديك وسعة VRAM، (2) شغّل أمر Ollama المطابق، (3) اضبط درجة الحرارة على 0.6 وامسح system prompt. إذا كان النموذج بطيئًا جدًا، انزل مستوى واحدًا؛ وإذا كان لديك VRAM إضافي، اصعد مستوى واحدًا لاستدلال أفضل.

V3 مقابل R1: هذا الجدول لـ R1 فقط

**DeepSeek-R1 هي العائلة الاستدلالية التي تثبّتها هذه الأوامر؛ أما DeepSeek-V3 فهو نموذج محادثة منفصل.** لا تتوقع تجربة V3 من هذه النماذج المقطّرة — فهي مضبوطة لإظهار الاستدلال خطوة بخطوة في الرياضيات والمنطق. كما أن V3 هو نموذج MoE بحجم 671B ولا يمكن تشغيله على عتاد المستهلك؛ راجع [بطاقة عتاد DeepSeek V3](/prompt-bites/deepseek-v3-local-hardware-requirements).

أدلة ذات صلة

▸جدول VRAM لنماذج DeepSeek-R1 المقطّرة — كل نموذج مقطّر حسب الكمّنة (Q4_K_M، Q8، FP16) مع VRAM والحد الأدنى من كرت الشاشة
▸أفضل نموذج استدلال محلي 2026: تصنيف DeepSeek-R1 — الدليل المصنّف الكامل مع المعايير والفئات
▸متطلبات العتاد المحلي لـ DeepSeek V3 — نظير نموذج المحادثة V3

الأسئلة الشائعة

أي نموذج DeepSeek مقطّر يعمل على RTX 4090؟▾

DeepSeek-R1-Distill-Qwen-32B. بصيغة Q4_K_M يحتاج إلى ~20.5 GB، ويتسع في RTX 4090 بسعة 24 GB (ضيّق على السياق)، ويتفوق على OpenAI o1-mini في عدة معايير استدلال. الأمر: `ollama run deepseek-r1:32b`.

ما أفضل نموذج DeepSeek مقطّر لكرت بسعة 8 GB؟▾

DeepSeek-R1-0528-Qwen3-8B هو أقوى نموذج استدلال صغير مقطّر ويتسع في 8 GB. النموذج 7B الأصلي المقطّر (`ollama run deepseek-r1:7b`) هو البديل المدعوم جيدًا.

لماذا النموذج المقطّر لدي بطيء؟▾

عادةً بسبب فيض VRAM — إذا لم يتسع النموذج، فإنه يفيض إلى ذاكرة النظام وتنهار سرعة المعالجة. انزل مستوى واحدًا (مثل 32B → 14B) كي يتسع النموذج بالكامل في VRAM.

هل عليّ اختيار الكمّنة؟▾

لا. أوامر `ollama run deepseek-r1:` تستخدم Q4_K_M افتراضيًا، وهو أفضل موازنة بين الحجم والجودة. راجع جدول VRAM إذا أردت أرقام Q8_0 أو FP16.

هل تريد الشرح الكامل؟

اقرأ الدليل الكامل →

لقطات سريعة ذات صلة

▸جدول ⁨VRAM⁩ لنماذج ⁨DeepSeek-R1 Distill⁩ (⁨2026⁩)

← العودة إلى لقطات سريعة