Key Takeaways
- Notebooks de 8 GB de RAM: use modelos 3B–7B em Q4_K_M. Velocidade na CPU: 10–25 tok/s.
- Apple Silicon M3/M4: 50–80 tok/s com Metal. O melhor hardware de notebook para LLMs locais.
- Intel Iris Xe: sem aceleração de GPU para LLMs. Somente CPU.
- Throttling térmico reduz a velocidade em 20–40% após 10–15 minutos. Use base de resfriamento.
- Recomendação para 8 GB: `ollama run llama3.2:3b`. Para 16 GB: `ollama run llama3.2:7b`.