¿El mejor mini PC para LLM local?
Respuesta rápida
Tres mini PCs destacan para inferencia local de LLMs: Mac Mini M4 entrega ~18 tok/s con memoria unificada y sin cuello de botella de VRAM, Minisforum UM790 Pro escala a 64 GB DDR5 para modelos más grandes, y Beelink SER8 ofrece buena relación calidad-precio con ~8 tok/s y Ryzen 9 8845HS. Los tres ejecutan modelos Q4 de 7–13B sin GPU dedicada.
- ▸Mac Mini M4: el más rápido para LLMs, ~18 tok/s en Llama 3 8B, eficiente en energía
- ▸Minisforum UM790 Pro: iGPU AMD Radeon 780M, hasta 64 GB de RAM unificada
- ▸Beelink SER8: Ryzen 9 8845HS, ~8 tok/s, alternativa económica
Actualizado: 2026-05
Puntos clave
- ✓Mac Mini M4 parte desde ~599 USD (~699 € en España), usa Apple Metal para aceleración GPU y alcanza ~18 tok/s en un modelo 7B Q4 consumiendo solo ~30 W bajo carga
- ✓Minisforum UM790 Pro (AMD Ryzen 9 7940HS) soporta hasta 64 GB DDR5 y ~8 tok/s en un modelo 7B mediante ROCm en Linux
- ✓La arquitectura de memoria unificada de Apple Silicon es la ventaja clave — la RAM del M4 se comparte entre CPU y GPU sin cuello de botella de VRAM
- ✓Beelink SER8 (Ryzen 9 8845HS) es la opción económica: mismo ~8 tok/s que el UM790 Pro pero con inferencia basada en CPU, menor consumo eléctrico y sin necesidad de configurar ROCm en Linux
Mac Mini M4 lidera en velocidad y eficiencia
El Mac Mini M4 alcanza ~18 tokens por segundo en un modelo 7B Q4, consume ~30 W bajo carga y parte desde aproximadamente 599 USD (~699 € en España) — lo que lo convierte en el mini PC más rápido para inferencia de LLMs locales. El chip M4 usa arquitectura de memoria unificada, lo que significa que la misma RAM física es compartida entre CPU y GPU sin sobrecarga por copia de datos. Para los usuarios que priorizan la velocidad, el M4 es la primera opción.
El Minisforum UM790 Pro es la opción escalable: AMD Ryzen 9 7940HS con iGPU Radeon 780M, hasta 64 GB DDR5 configurados como memoria unificada y ~8 tok/s en Linux con ROCm. El Beelink SER8 (Ryzen 9 8845HS) iguala al UM790 Pro en rendimiento pero usa inferencia solo por CPU — sin GPU dedicada — lo que lo convierte en la opción económica para usuarios en Windows o Linux que quieren evitar la configuración de ROCm.
La siguiente tabla compara los tres mini PCs en CPU/GPU, mejor configuración de memoria y velocidad medida de LLM.
| Mini PC | CPU/GPU | Mejor configuración | Velocidad LLM (7B Q4) |
|---|---|---|---|
| Mac Mini M4 | Apple M4 | 16 GB unificada | ~18 tok/s |
| Minisforum UM790 Pro | Ryzen 9 7940HS | 64 GB DDR5 | ~8 tok/s |
| Beelink SER8 | Ryzen 9 8845HS | 64 GB DDR5 | ~8 tok/s |
La memoria unificada es el diferenciador clave para el rendimiento de LLMs
Los mini PCs estándar con ranuras para GPU dedicada no son útiles para inferencia de LLMs porque el VRAM de la GPU está fijado de fábrica — típicamente 4–8 GB — y no puede expandirse. El Mac Mini M4 y el UM790 Pro resuelven esto mediante inferencia basada en GPU con memoria unificada. El Beelink SER8 adopta un enfoque diferente: su Ryzen 9 8845HS usa inferencia solo por CPU, que es más lenta pero no requiere configuración de GPU.
El Mac Mini M4 con 16 GB de memoria unificada supera al UM790 Pro con 32 GB DDR5 en velocidad de inferencia pura porque el ancho de banda de memoria de Apple (~68 GB/s) y la aceleración GPU Metal son más eficientes que la iGPU Radeon 780M. La ventaja del UM790 Pro es la posibilidad de expandirse a 64 GB, lo que permite ejecutar modelos más grandes como 13B y 30B Q4 que no caben en 16 GB.
Para una guía completa de selección de hardware para LLM local, consulta el resumen de las mejores interfaces para Ollama, que cubre el lado de software de la configuración local.
Para recomendaciones específicas de mini PCs en Japón con enlaces de Amazon.co.jp y precios en JPY, consulta nuestra guía de mejores mini PCs para LLMs locales en Japón.