Skip to main content
PromptQuorumPromptQuorum
Home/Local LLMs/Mejores GPUs AMD para LLMs locales
GPU Buying Guides

Mejores GPUs AMD para LLMs locales

·7 min de lectura·Por Hans Kuepper · Fundador de PromptQuorum, herramienta de despacho multi-modelo · PromptQuorum

La AMD RX 6800 XT y la RX 7900 XTX son alternativas sólidas a NVIDIA, con un rendimiento por dólar 15-20% mejor, pero sufren de menor compatibilidad con ONNX Runtime y los drivers de vLLM.

La AMD RX 6800 XT y la RX 7900 XTX son alternativas sólidas a NVIDIA, con un rendimiento por dólar 15-20% mejor, pero sufren de menor compatibilidad con ONNX Runtime y los drivers de vLLM. A partir de abril de 2026, AMD ROCm (HIP) ha madurado, aunque las capas de compatibilidad añaden fricción. NVIDIA CUDA sigue siendo el camino más sencillo para LLMs locales. Usa AMD solo si encuentras una gran oferta de segunda mano o ya tienes hardware AMD.

Key Takeaways

  • La AMD RX 6800 XT (16GB, ~$300-350 de segunda mano) y la RX 7900 XTX (24GB, ~$400-500 de segunda mano) son las únicas opciones viables para LLMs locales. Los precios pueden variar según tu país.
  • Rendimiento por dólar: AMD es un 20-30% más barata que NVIDIA, pero la fricción de software cuesta entre 5 y 10 horas de configuración.
  • Ollama: soporte AMD limitado (el path de ROCm es inestable, el fallback a CPU es lento). No recomendado.
  • vLLM: soporte completo para AMD ROCm desde v0.6.0, pero la configuración requiere instalar drivers manualmente. Funciona bien una vez superada la fase de instalación.
  • Text Generation WebUI: excelente soporte para AMD vía ROCm. La mejor experiencia de usuario en AMD.
  • Llama.cpp: soporte nativo para AMD (backend HIP). Rendimiento sólido. El camino recomendado en AMD.
  • Coste de configuración: planifica 5-10 horas de depuración de drivers ROCm, compilación de HIPCC y compatibilidad de kernel.
  • Veredicto (abril 2026): usa AMD solo si ya tienes hardware AMD o encuentras una oferta de segunda mano excelente (~$300 por una tarjeta de 16GB). Si no, NVIDIA CUDA sigue siendo más sencillo.

¿Qué GPUs AMD realmente valen la pena?

  • RX 6800 XT (16GB GDDR6): la reina del valor en AMD. Lanzada en 2020. Sigue siendo sólida para inferencia de 7B-22B. De segunda mano: ~$300-350.
  • RX 6900 XT (16GB GDDR6): marginalmente más rápida que la 6800 XT. Poco común. De segunda mano: ~$350-400. El aumento de precio no merece la pena.
  • RX 7900 XT (20GB GDDR6): arquitectura RDNA 3 más nueva. Un 20% más rápida que la 6800 XT. De segunda mano: ~$400-480. Buena para 70B Q4.
  • RX 7900 XTX (24GB GDDR6): la GPU AMD de consumo de gama alta. 24GB de VRAM es un punto de inflexión para modelos de 70B. De segunda mano: ~$450-550. Velocidad comparable a la RTX 4090.
  • Radeon Pro W6800 (32GB): tarjeta de nivel empresarial, más barata de segunda mano (~$200-300). Más lenta, pero los 32GB son excelentes para 70B Q8. Opción de nicho.

¿Cómo se comparan las GPUs AMD con RTX en precio y rendimiento?

GPUVRAMTFLOPSPrecio (2ª mano)Rend./$ vs. RTXRTX equivalente
RX 6800 XT16GB1,952~$300-350+25%RTX 3080 (más lenta)
RX 7900 XT20GB2,540~$400-480+20%RTX 4080 (similar)
RX 7900 XTX24GB2,750~$450-550+15%RTX 4090 (velocidad similar)
RTX 308010GB1,456~$350-400----
RTX 409024GB2,752~$1,000-1,300----

¿Cuál es la fricción de configuración de ROCm para AMD?

1. Instala los drivers AMD ROCm: `apt-get install rocm-dkms` (Ubuntu). En Windows, usa el instalador .exe manual. Tarda unos 30 min.

2. Verifica el compilador HIP: `hipcc --version`. A menudo falla en el primer intento. Depura la compatibilidad de kernel para tu GPU.

3. Instala HIPCC (el compilador HIP-to-C++ de AMD): `apt-get install hip-runtime-amd`. Otra cadena de dependencias.

4. Prueba con un LLM pequeño: ejecuta inferencia para verificar que la aceleración por GPU funciona. El fallback a CPU es frecuente.

5. Soluciona incompatibilidades de versión de drivers: ROCm v5.7 funciona con el kernel 5.15 pero no con 6.x. Consume 2-4 horas de depuración.

NVIDIA CUDA en comparación: `nvidia-cuda-toolkit` → un apt-get, acceso instantáneo a la GPU. AMD requiere entre 5 y 10 veces más fricción.

¿Puedes ejecutar Ollama y vLLM en AMD?

Ollama en AMD: experimental e inestable a partir de abril de 2026. El path de ROCm a veces funciona, el fallback a CPU es lento. No recomendado.

vLLM en AMD: soporte completo para ROCm desde v0.6.0. Funciona bien, pero requiere configuración manual de drivers ROCm/HIP. Buena opción si superas la fase de instalación.

Text Generation WebUI: excelente soporte para AMD ROCm. La mejor experiencia de usuario en AMD. Recomendado.

Llama.cpp: backend HIP nativo. Rendimiento sólido. El camino AMD más sencillo. Recomendado.

LM Studio: solo NVIDIA. Sin soporte para AMD.

A partir de abril de 2026: vLLM + llama.cpp son tus opciones en AMD. Ollama no es fiable.

¿Cuándo deberías comprar AMD en lugar de NVIDIA?

Compra AMD si:

  • Encuentras una RX 7900 XTX de segunda mano por menos de $450 (infravalorada frente al valor de la RTX 4090).
  • Ya tienes hardware AMD y quieres mantener coherencia en el ecosistema.
  • Estás construyendo un clúster y priorizas el rendimiento por dólar sobre la facilidad de configuración.

No compres AMD si:

  • Quieres una experiencia plug-and-play. NVIDIA CUDA es más rápido de poner en marcha.
  • Necesitas Ollama. El soporte AMD es poco fiable.
  • Tienes poco tiempo. La depuración de ROCm puede consumir más de 10 horas.

Errores comunes al adoptar AMD

  • Comprar una RX 6700 (12GB) creyendo que equivale a una 3060 12GB — es un 20% más lenta y a menudo difícil de encontrar de segunda mano.
  • Asumir que ROCm «simplemente funciona» como CUDA — planifica entre 5 y 10 horas de solución de problemas de compatibilidad de drivers y kernel.
  • Usar Ollama con AMD esperando una integración fluida — el path de ROCm es inestable; llama.cpp o vLLM son mejores opciones.

Preguntas frecuentes

¿Debo comprar la AMD RX 6800 XT o la NVIDIA RTX 3080 para LLMs locales?

RTX 3080 si valoras la simplicidad (CUDA funciona sin problemas). RX 6800 XT si quieres un 25% más de valor y no te importan 5-10 horas de configuración de ROCm.

¿La AMD RX 7900 XTX es mejor que la RTX 4090?

Velocidad similar, misma VRAM (24GB). La RX 7900 XTX es $200-300 más barata de segunda mano ($450-550 vs. $1,000-1,300). La configuración de ROCm es el contrapeso.

¿Puedo usar GPUs AMD con Ollama?

Técnicamente sí, pero espera comportamientos inestables. El fallback a CPU es frecuente. Usa vLLM o llama.cpp en su lugar para AMD.

¿Cuál es el mejor camino AMD para LLMs locales en 2026?

Llama.cpp (backend HIP) + Text Generation WebUI. Ambos tienen buen soporte para AMD. Evita Ollama.

¿Necesito Ubuntu para AMD ROCm, o Windows funciona también?

El soporte en Windows existe (HIP on Windows), pero es más reciente y menos estable. Ubuntu es el camino recomendado.

¿Es la RX 6700 o 6750 buena para modelos de 7B?

La RX 6700 (12GB) funciona, pero es un 20% más lenta que la RX 6800 XT. Cómprala solo si cuesta menos de $250. Si no, apuesta por la 6800 XT.

¿Puedo combinar GPUs AMD y NVIDIA en un mismo sistema?

Teóricamente sí, pero la gestión es una pesadilla. Cada GPU necesita su propio runtime CUDA/HIP. No se recomienda.

Fuentes

  • Documentación de AMD ROCm y GitHub: compilador HIP, matriz de compatibilidad de drivers, ejemplos de inferencia con LLMs
  • vLLM GitHub: implementación del backend AMD/ROCm y estado de soporte (v0.6.0+)
  • Llama.cpp GitHub: backend HIP para soporte de GPUs AMD
  • Las GPUs AMD ofrecen buenas velocidades en tokens por segundo, pero la velocidad por sí sola no determina la calidad de las respuestas. Lo que le preguntas al modelo importa tanto como la rapidez de respuesta: context windows explained explica cómo estructurar solicitudes más largas dentro de los límites de memoria de la GPU.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

Mejores GPUs AMD para LLMs locales 2026: Guía de comparación