Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/LLMs Locais em Notebook: RAM, Velocidade e Temperatura 2026
Getting Started

LLMs Locais em Notebook: RAM, Velocidade e Temperatura 2026

·8 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

Um modelo 7B roda a 10–25 tok/s na CPU ou 50–80 tok/s no Apple Silicon. Para notebooks de 8 GB: use modelos 3B–7B em Q4_K_M. O throttling térmico reduz a velocidade em 20–40% após 10–15 minutos de uso contínuo. Solução: base de resfriamento + desativar Turbo Boost.

Executar um LLM local em um notebook é possível — mesmo com 8 GB de RAM — mas o desempenho depende muito do tamanho do modelo, da RAM e do gerenciamento térmico. Um modelo 7B roda a 10–25 tok/s na CPU ou 50–80 tok/s no Apple Silicon, tornando notebooks viáveis para desenvolvimento, testes e fluxos de trabalho de IA leves.

Key Takeaways

  • Notebooks de 8 GB de RAM: use modelos 3B–7B em Q4_K_M. Velocidade na CPU: 10–25 tok/s.
  • Apple Silicon M3/M4: 50–80 tok/s com Metal. O melhor hardware de notebook para LLMs locais.
  • Intel Iris Xe: sem aceleração de GPU para LLMs. Somente CPU.
  • Throttling térmico reduz a velocidade em 20–40% após 10–15 minutos. Use base de resfriamento.
  • Recomendação para 8 GB: `ollama run llama3.2:3b`. Para 16 GB: `ollama run llama3.2:7b`.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

Llama e Phi em notebooks de 8–16 GB: velocidade e térmica