أفضل نموذج DeepSeek مقطّر لكرت الشاشة لديك (2026)
تحتوي هذه الصفحة على روابط مرجعية لمنتجات طرف ثالث. لا يشارك PromptQuorum في أي برنامج تابع — هذه روابط عادية لا تدر أي عمولة. النقر على الروابط والخطوات التالية تقع على عاتقك بالكامل. لا تمثل هذه الروابط أي تأييد أو تحقق من قِبَل PromptQuorum.
إجابة سريعة
حدّد كرتك: RTX 3060 12GB → 7B، وRTX 4060 Ti 16GB → 14B، وRTX 4070/4080 → 14B أو 32B، وRTX 4090 → 32B، وكرتان/48 GB → 70B. لأفضل نموذج صغير على 8 GB، شغّل DeepSeek-R1-0528-Qwen3-8B. كل نموذج يعمل بأمر Ollama واحد بصيغة Q4_K_M.
- ▸RTX 3060 12GB → deepseek-r1:7b — ~30–40 tok/s
- ▸RTX 4060 Ti 16GB → deepseek-r1:14b — ~25–35 tok/s (موصى به)
- ▸RTX 4070 / 4080 → deepseek-r1:14b أو :32b — 14B ~40–50، 32B ~15–20 tok/s
- ▸RTX 4090 24GB → deepseek-r1:32b — ~30–40 tok/s، يتفوق على o1-mini
- ▸كرتان / 48 GB → deepseek-r1:70b — ~12–18 tok/s
- ▸كرت 8 GB، أفضل نموذج صغير → DeepSeek-R1-0528-Qwen3-8B
تحديث: 2026-06-19
النقاط الرئيسية
- ✓RTX 3060 12GB → نموذج 7B مقطّر؛ RTX 4060 Ti 16GB → 14B (الخيار الأمثل)؛ RTX 4090 → 32B (يتفوق على o1-mini).
- ✓كرتان أو 48 GB → نموذج 70B مقطّر، وهو الأقوى من بين الستة.
- ✓على 8 GB، أفضل نموذج صغير هو DeepSeek-R1-0528-Qwen3-8B.
- ✓كل نموذج يُثبَّت بصيغة Q4_K_M بأمر واحد، مثل `ollama run deepseek-r1:14b`.
- ✓اضبط درجة الحرارة على 0.6 ولا تستخدم system prompt لتجنّب أعطال التكرار في R1.
- ✓هذه عائلة R1 الاستدلالية — وليست DeepSeek-V3 وهو نموذج محادثة.
كرت الشاشة → نموذج DeepSeek-R1 مقطّر → أمر Ollama
حدّد كرت الشاشة الذي تمتلكه في العمود الأول واقرأ عبر الصف. أرقام tok/s تقريبية لأحمال الاستدلال بصيغة Q4_K_M وتتغير حسب طول السياق وإعدادات أخذ العينات. عندما يتسع نموذجان، فالأكبر يستدل بشكل أفضل والأصغر أسرع.
| GPU (VRAM) | أفضل نموذج مقطّر | أمر Ollama | tok/s المتوقع |
|---|---|---|---|
| RTX 3060 12GB (فئة 8 GB) | DeepSeek-R1-Distill-Qwen-7B | ollama run deepseek-r1:7b | ~30–40 |
| 8 GB، أفضل صغير | DeepSeek-R1-0528-Qwen3-8B | ollama run deepseek-r1-0528-qwen3:8b | ~30–40 |
| RTX 4060 Ti 16GB | DeepSeek-R1-Distill-Qwen-14B | ollama run deepseek-r1:14b | ~25–35 |
| RTX 4070 / 4080 | 14B (سريع) أو 32B (إذا 16 GB+) | ollama run deepseek-r1:14b | 14B ~40–50 |
| RTX 4090 24GB | DeepSeek-R1-Distill-Qwen-32B | ollama run deepseek-r1:32b | ~30–40 |
| كرتان / 48 GB | DeepSeek-R1-Distill-Llama-70B | ollama run deepseek-r1:70b | ~12–18 |
كيفية استخدام هذا الجدول في 3 خطوات
ثلاثة أسطر: (1) حدّد كرت الشاشة لديك وسعة VRAM، (2) شغّل أمر Ollama المطابق، (3) اضبط درجة الحرارة على 0.6 وامسح system prompt. إذا كان النموذج بطيئًا جدًا، انزل مستوى واحدًا؛ وإذا كان لديك VRAM إضافي، اصعد مستوى واحدًا لاستدلال أفضل.
V3 مقابل R1: هذا الجدول لـ R1 فقط
**DeepSeek-R1 هي العائلة الاستدلالية التي تثبّتها هذه الأوامر؛ أما DeepSeek-V3 فهو نموذج محادثة منفصل.** لا تتوقع تجربة V3 من هذه النماذج المقطّرة — فهي مضبوطة لإظهار الاستدلال خطوة بخطوة في الرياضيات والمنطق. كما أن V3 هو نموذج MoE بحجم 671B ولا يمكن تشغيله على عتاد المستهلك؛ راجع [بطاقة عتاد DeepSeek V3](/prompt-bites/deepseek-v3-local-hardware-requirements).
أدلة ذات صلة
- ▸جدول VRAM لنماذج DeepSeek-R1 المقطّرة — كل نموذج مقطّر حسب الكمّنة (Q4_K_M، Q8، FP16) مع VRAM والحد الأدنى من كرت الشاشة
- ▸أفضل نموذج استدلال محلي 2026: تصنيف DeepSeek-R1 — الدليل المصنّف الكامل مع المعايير والفئات
- ▸متطلبات العتاد المحلي لـ DeepSeek V3 — نظير نموذج المحادثة V3
الأسئلة الشائعة
أي نموذج DeepSeek مقطّر يعمل على RTX 4090؟▾
ما أفضل نموذج DeepSeek مقطّر لكرت بسعة 8 GB؟▾
لماذا النموذج المقطّر لدي بطيء؟▾
هل عليّ اختيار الكمّنة؟▾
هل تريد الشرح الكامل؟
اقرأ الدليل الكامل →لقطات سريعة ذات صلة