¿Cuáles son los requisitos de hardware para ejecutar DeepSeek V3 en local?
Respuesta rápida
No. DeepSeek V3 (671B MoE) necesita ~400 GB RAM en Q4_K_M — muy por encima de cualquier hardware de consumo. Alternativa práctica: DS-R1-Distill-Qwen-32B (20.5 GB VRAM, 94% MATH-500).
- ▸DeepSeek V3: 671B MoE — ~400 GB RAM en Q4_K_M
- ▸Ninguna GPU de consumo puede cargarlo
- ▸DS-R1-Distill-Qwen-32B: 20.5 GB VRAM, 94% MATH-500 ✓
Actualizado: 2026-05
Puntos clave
- ✓DeepSeek V3 (671B MoE) en Q4_K_M necesita ~400 GB RAM — imposible con hardware de consumo en 2026
- ✓DS-R1-Distill-Qwen-32B: 20.5 GB VRAM, 94% MATH-500 — el modelo de razonamiento local más práctico
- ✓Con 8 GB VRAM: DS-R1-Distill-Qwen-7B (5.5 GB), 88% MATH-500
- ✓Nota MoE: DeepSeek V3 activa solo ~37B parámetros por forward pass, pero los 671B de pesos deben estar en memoria simultáneamente
Verificación de la realidad del hardware de DeepSeek V3
**Modelo completo (671B, Q4_K_M):** ~400 GB RAM — se necesita una workstation de servidor. Ninguna GPU de consumo lo soporta.
**Por qué MoE no ayuda aquí:** DeepSeek V3 activa solo ~37B parámetros por forward pass. Pero todos los 671B tensores de pesos deben estar en memoria simultáneamente.
Alternativas prácticas por nivel de hardware
**8 GB VRAM (RTX 3060 / M2):** DS-R1-Distill-Qwen-7B Q4_K_M — 88% MATH-500, el modelo de razonamiento local más fuerte en 7B.
**12–16 GB VRAM (RTX 3080 / M2 Pro):** DS-R1-Distill-Qwen-14B Q4_K_M — 90% MATH-500, razonamiento paso a paso en problemas complejos.
**24 GB VRAM (RTX 4090 / M3 Max):** DS-R1-Distill-Qwen-32B Q4_K_M — 94% MATH-500, supera al V3 completo en benchmarks de matemáticas estandarizados.
**64+ GB RAM (sin GPU dedicada):** Qwen2.5-72B Q4_K_M — inferencia CPU, 0.5–1 tok/s, mejor modelo local grande de propósito general.
Preguntas frecuentes
¿Quieres el desglose completo?
Leer la guía completa →Prompt Bites relacionados