Respuestas rápidas a preguntas sobre LLM locales
65 guías de respuesta rápida. Requisitos de VRAM, recomendaciones de Ollama, comparativas de hardware y consejos de configuración — respondidas en 60 segundos o menos.
| VRAM | Mejor modelo (mayo de 2026) | Cuantización | Caso de uso |
|---|---|---|---|
| 4 GB | Phi-4 Mini | Q4 | Chat básico, tareas pequeñas |
| 6 GB | Llama 3 8B | Q4_K_M | Chat y programación diarios |
| 8 GB | Mistral 7B | Q5_K_M | Equilibrio entre calidad y velocidad |
| 12 GB | Qwen 14B | Q4_K_M | Programación y razonamiento |
| 16 GB | Qwen 32B | Q4_K_M | Tareas complejas de varios pasos |
| 24 GB | Llama 70B | Q4_K_M (parcial) | Calidad casi de producción |
| 48+ GB | Llama 70B | Q5_K_M o superior | Modelos de precisión completa |
Nuevo este mes
65Recién publicado — desaparece de este lugar después de 14 días
ACuantización y VRAM
Cuánta memoria necesita, qué formato de cuantización elegir y árboles de decisión de VRAM.
BOllama
Versiones más recientes, mejores modelos, ventanas de contexto, visión y uso solo con CPU.
CComparativas de herramientas
Comparaciones uno a uno: Ollama vs LM Studio, Jan vs LM Studio, Qwen vs DeepSeek.
DComparativas de modelos
Mejores modelos 14B, modelos MoE, mini PCs y comparativas directas entre modelos.
EHardware específico
Recomendaciones de hardware y guías de compra: GPUs por presupuesto, mini-PCs, SSDs, GPUs en la nube y eGPUs.
FRespuestas rápidas
Respuestas de sí/no y un solo número: límites de RAM, recomendaciones de laptops.
GIngeniería de prompts
Definiciones rápidas y mejores listas para conceptos de ingeniería de prompts.
HPrivacidad y cumplimiento normativo
Cumplimiento del RGPD, soberanía de datos y despliegue de IA local con privacidad garantizada.