Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/Quanta memória unificada você precisa para LLMs locais? 16GB vs 36GB vs 64GB vs 128GB (2026)
Hardware & Performance

Quanta memória unificada você precisa para LLMs locais? 16GB vs 36GB vs 64GB vs 128GB (2026)

·10 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

16GB: apenas modelos 7B (justo). 36GB: 13B com conforto, 34B Q4 justo. 64GB: 34B Q5 com conforto, 70B Q3 no limite. 128GB: 70B Q5 com conforto. Compre a memória máxima no momento da compra — você não pode atualizá-la depois. Mínimo recomendado: 36GB; M5 Pro 64GB está preparado para o futuro até 2027.

Guia de dimensionamento de memória para LLMs locais no Mac: quais modelos cabem em 16GB, 36GB, 64GB e 128GB. Inclui tabela de quantização (Q3, Q4, Q5, Q8), overhead real e dicas de compra. Tabela completa de tamanhos de modelos: de 3.8B (2.1 GB) até modelos de 405B.

Key Takeaways

  • 16GB: apenas modelos até 7B (Llama 3.2 8B Q4 = ~5GB). Muito restrito para uso regular.
  • 36GB: 13B com conforto (7–8GB livres). 34B Q4 no limite (~33GB). Mínimo recomendado.
  • 64GB: 34B Q5 com conforto. 70B Q3 barely. Melhor equilíbrio para 2026–2027.
  • 128GB: 70B Q5 com conforto. Preparado para modelos futuros. Ideal para uso profissional.
  • Você não pode atualizar a memória depois da compra — compre o máximo que puder pagar.

Tabela de dimensionamento de memória: quais modelos cabem?

MemóriaModelos confortáveisModelos no limiteNão recomendado
16GBaté 7B Q47B Q513B+
36GBaté 13B Q534B Q470B
64GBaté 34B Q570B Q3405B
128GBaté 70B Q570B Q8405B (parcialmente)

Overhead de quantização e sistema

Regra prática: tamanho do modelo em GB = (parâmetros em B × bits) / 8. Mais 2–4 GB de overhead do sistema.

  • Llama 3.3 8B Q4 = (8B × 4 bits) / 8 = 4 GB + ~1 GB overhead = ~5 GB total.
  • Llama 3.3 70B Q4 = (70B × 4 bits) / 8 = 35 GB + ~2 GB overhead = ~37 GB total.
  • O macOS usa 2–4 GB adicionais para o sistema — sempre subtraia isso da memória disponível.
  • Reserve pelo menos 4 GB livres após carregar o modelo para o contexto de inferência.

Dicas de compra de memória para Mac

  • Não é atualizável: A memória do Apple Silicon está soldada na placa. Decida com cuidado.
  • Recomendação para 2026: M5 Pro com 64GB oferece o melhor equilíbrio para a maioria dos usuários.
  • Para uso profissional: Mac Studio M4 Max com 128GB ou M4 Ultra com 192GB.
  • Orçamento limitado: Mac mini M4 com 16GB é funcional apenas para modelos 7B — considere 24GB se disponível.

Perguntas frequentes sobre memória unificada para LLMs

16GB de memória unificada é suficiente para LLMs locais?

16GB é suficiente para modelos até 7B Q4 (ex.: Llama 3.2 8B Q4 = ~5GB). Você não consegue rodar modelos 13B+ confortavelmente. Para uso regular, 36GB é o mínimo recomendado.

Devo comprar 64GB ou 128GB para LLMs?

64GB roda 34B Q5 confortavelmente e 70B Q3 no limite. 128GB roda 70B Q5 com conforto. Se você planeja usar modelos 70B regularmente, vá para 128GB. Lembre-se: você não pode atualizar a memória depois da compra.

Qual Mac tem a melhor memória para LLMs em 2026?

Mac Studio M4 Max (128GB, ~$3.999) ou M4 Ultra (192GB, ~$6.999) são os melhores. Para uso pessoal, Mac mini M4 Pro (64GB, ~$2.299) oferece excelente custo-benefício.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

Guia de memória para LLMs locais 2026: 16–128GB