Key Takeaways
- RTX 3060 12 GB (US$ 200-250 usada): Roda todos os modelos 7B-8B em Q4/Q5 e a maioria dos densos 13B-14B em Q4. Melhor opção econômica.
- RTX 3060 6 GB: Limitada a modelos 3B (Phi-4 Mini, Llama 3.2 3B). Insuficiente para 7B.
- Melhor modelo geral em 12 GB: Qwen3 14B a ~9 GB VRAM, 9-12 tok/s. Melhor qualidade densa que cabe confortavelmente.
- Melhor modelo de código em 12 GB: Qwen3 8B a 16-20 tok/s.
- Melhor modelo de raciocínio em 12 GB: DeepSeek-R1 7B a 10-12 tok/s. Chain-of-thought.
- Descarte se: você quiser modelos de 70B ou 13B em Q8 -- você precisa de 24 GB+ (RTX 4090).
O que você pode rodar na RTX 3060 12 GB?
A RTX 3060 12 GB é a melhor GPU econômica para LLMs locais em 2026. 12 GB de VRAM cabem todos os modelos 7B em quantização Q4/Q5, e a maioria dos 13B em Q4.
| Modelo | Tamanho | Quantização | VRAM usada | Velocidade | Ideal para |
|---|---|---|---|---|---|
| Qwen3 14B | 14B (denso) | Q4_K_M | ~9 GB | 9-12 tok/s | Melhor qualidade geral que cabe |
| Qwen3 8B | 8B | Q4_K_M | ~7 GB | 16-20 tok/s | Código, uso geral |
| Mistral Small v0.3 | 7B | Q4_K_M | ~7 GB | 18 tok/s | Seguimento de instruções |
| DeepSeek-R1 7B | 7B | Q4_K_M | ~7 GB | 10-12 tok/s | Raciocínio, matemática |
Qwen3 14B (denso) é o modelo de maior qualidade que cabe confortavelmente numa RTX 3060 12 GB em Q4_K_M, usando ~9 GB. `ollama pull qwen3:14b`.
O que você pode rodar na RTX 3060 6 GB?
A variante de 6 GB está muito limitada. Apenas modelos de 3B cabem confortavelmente. Modelos 7B em Q4 precisam de ~7 GB -- mais do que disponível.
- Phi-4 Mini 3.8B (Q4): ~3 GB VRAM, 20-25 tok/s. Melhor raciocínio neste tamanho.
- Llama 3.2 3B (Q4): ~2,5 GB VRAM, 25-35 tok/s. Opção mais rápida.
- Gemma 2 2B (Q4): ~1,7 GB VRAM, 35-45 tok/s. Modelo mais leve.
- Recomendação: Se você tem uma placa de 6 GB, atualize para 12 GB usada (US$ 200-250) antes de investir tempo em soluções alternativas.
RTX 3060 vs outras GPUs econômicas
| GPU | VRAM | Preço (usada) | Velocidade 7B | Modelo máx. | Veredicto |
|---|---|---|---|---|---|
| RTX 3060 12 GB ★ | 12 GB | US$ 200-250 | 15-20 tok/s | 13B (Q4) | Melhor custo-benefício |
| RTX 3060 6 GB | 6 GB | US$ 150-180 | Offloading lento | 3B (Q4) | Muito limitada para LLMs |
| RTX 3090 24 GB | 24 GB | US$ 450-500 | 35-50 tok/s | 34B (Q4) | Melhor valor para 24 GB |
| RTX 4070 12 GB | 12 GB | — | 25-30 tok/s | 13B (Q4) | Mais rápida mas 2× mais cara |
Perguntas frequentes
A RTX 3060 12 GB é boa para LLMs locais em 2026?
Sim. É a melhor GPU econômica para LLMs locais em 2026. 12 GB de VRAM cabem todos os modelos 7B-8B e a maioria dos 13B-14B em Q4. A US$ 200-250 usada, oferece o melhor custo-benefício da categoria.
A RTX 3060 12 GB funciona para português?
Sim. A GPU apenas executa o modelo -- a qualidade do idioma depende do modelo escolhido. Qwen3 8B ou Qwen3 14B (ambos com excelente suporte em português) rodam bem na RTX 3060 12 GB.
Onde comprar uma RTX 3060 12 GB usada no Brasil?
Mercado Livre, OLX e grupos de Facebook são as melhores fontes para GPUs usadas no Brasil. Espere pagar R$ 900-1.200 por uma RTX 3060 12 GB usada em bom estado. Verifique a procedência e teste antes de comprar.