Skip to main content
PromptQuorumPromptQuorum

¿Mejor GPU por menos de $300 para LLMs locales en 2026?

Esta página contiene enlaces de referencia a productos de terceros. PromptQuorum no participa en ningún programa de afiliados — son enlaces simples que no generan comisión. Hacer clic en los enlaces y los pasos siguientes son de su entera responsabilidad. Estos enlaces no representan ningún respaldo ni verificación por parte de PromptQuorum.

Respuesta rápida

La RTX 3060 12 GB usada a $150-220 es la mejor GPU por menos de $300 para LLMs locales — 12 GB de VRAM ejecuta todos los modelos 7B y la mayoría de los 14B.

  • RTX 3060 12 GB ejecuta Llama 3 8B Q4_K_M a ~25 tok/s y Qwen 14B Q4_K_M a ~15 tok/s.
  • RX 6700 XT 12 GB es $20-40 más barata pero requiere Linux para ROCm; evítala en Windows.
  • Evita GPUs de 8 GB por menos de $300 — el límite de VRAM bloquea completamente los modelos 14B.

Actualizado: 2026-05

Hardware-SpecificIntermedio

Puntos clave

  • Mejor opción: NVIDIA RTX 3060 12 GB usada — CUDA funciona al instante con Ollama y llama.cpp
  • Opción más barata: AMD RX 6700 XT usada — 12 GB de VRAM, pero la configuración de ROCm lleva 3-5 horas
  • Ambas tarjetas ejecutan todos los modelos 7B y la mayoría de los 13B en Q4; ninguna puede con un modelo 70B
  • Compra la RTX 3060 en su versión de 12 GB — la variante de 6 GB solo ejecuta modelos 3B y no vale la pena

Mejor opción: NVIDIA RTX 3060 12 GB usada

La NVIDIA RTX 3060 12 GB usada es la mejor GPU por menos de $300 para LLMs locales porque 12 GB de VRAM más soporte CUDA sin configuración te dan un equipo LLM funcional en minutos. A $150-250 en el mercado de segunda mano de mayo de 2026, ejecuta Mistral 7B, Llama 3 8B y Qwen3 8B a 15-20 tokens por segundo, y la mayoría de los modelos 13B en Q4.

La RTX 3060 gana en software. Ollama y llama.cpp detectan las GPU NVIDIA vía CUDA automáticamente en Windows y Linux — sin buscar drivers, sin ROCm. La AMD RX 6700 XT ($130-200 usada) ahorra $30-80 y tiene la misma capacidad de 12 GB, pero la configuración de ROCm en Linux suele costar 3-5 horas y no está soportada en Windows para inferencia rápida.

Elige la RX 6700 XT solo si el presupuesto es el único factor decisivo y te manejas bien en Linux. Para todos los demás, la RTX 3060 12 GB es la primera GPU más segura. Evita la variante de 6 GB de la RTX 3060 — parece idéntica en los listados pero solo cabe modelos 3B.

RTX 3060 12 GB vs RX 6700 XT para LLMs locales

Ambas tarjetas tienen 12 GB de VRAM, por lo que la capacidad de modelos es idéntica — la decisión es CUDA frente a ROCm. Los precios de abajo son una instantánea del mercado de segunda mano de EE. UU. de mayo de 2026; la escasez de memoria de 2026 mantiene los precios de GPU volátiles, así que comprueba antes de comprar.

GPUVRAMPrecio (mayo 2026)ConfiguraciónIdeal para
RTX 3060 12 GB12 GB$150-250 usadaCUDA, instantáneoMejor opción — sin fricción
RX 6700 XT12 GB$130-200 usadaROCm, 3-5 horasLa más barata, acepta setup AMD

Lectura relacionada

Respuestas rápidas sobre GPU por menos de $300 para LLMs locales

¿Una GPU de $300 puede ejecutar LLMs locales bien?
Sí. Una RTX 3060 12 GB usada o una RX 6700 XT ejecuta todos los modelos 7B a 15-20 tokens por segundo y la mayoría de los 13B en cuantización Q4. Ambas tienen 12 GB de VRAM, suficiente para chat general, asistencia de código y resúmenes.
¿Por qué elegir la RTX 3060 sobre la RX 6700 XT más barata?
La RTX 3060 usa NVIDIA CUDA, que Ollama y llama.cpp detectan automáticamente. La RX 6700 XT necesita ROCm — normalmente 3-5 horas en Linux y sin soporte en Windows para inferencia rápida. Los $30-80 que ahorras raramente compensan ese tiempo.
¿Debo comprar la RTX 3060 de 6 GB o de 12 GB?
Compra la versión de 12 GB. La RTX 3060 de 6 GB solo cabe modelos 3B, la mitad del conteo de parámetros de la clase 7B. Las dos variantes parecen idénticas en los listados — confirma la VRAM antes de comprar.
¿Puede una GPU por menos de $300 ejecutar un modelo 70B?
No. Un modelo 70B en Q4 necesita aproximadamente 40 GB de VRAM. Una tarjeta de 12 GB llega como máximo a modelos 14B en Q4. Para modelos más grandes necesitas un nivel superior o una configuración multi-GPU.