Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/Consumo de Energia de LLMs Locais 2026: RTX 4090, RTX 5090 e M5 Max Comparados
Hardware & Performance

Consumo de Energia de LLMs Locais 2026: RTX 4090, RTX 5090 e M5 Max Comparados

·10 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

RTX 4090: 575W sob carga, ~R$280/mês (tarifa residencial média brasileira de R$0,90/kWh). RTX 5090: 575W com 32 GB GDDR7. Apple M5 Max: 30W total (10× mais eficiente por token que NVIDIA). Planeje a fonte de alimentação: RTX 4090/5090 exige fonte de 1200W+.

Executar LLMs locais consome uma quantidade significativa de energia. A RTX 4090 consome 575W sob carga (fonte de 1200W necessária, ~R$280/mês a R$0,90/kWh tarifa residencial média brasileira). A RTX 5090 consome 575W com 32 GB de VRAM GDDR7. Apple M5 Max executa modelos 7B com apenas 30W no total — 10× mais eficiente energeticamente por token que a NVIDIA. A partir de abril de 2026, entender os requisitos de energia evita danos ao hardware e ajuda a planejar os custos de eletricidade.

Slide Deck: Consumo de Energia de LLMs Locais 2026: RTX 4090, RTX 5090 e M5 Max Comparados

Apresentação interativa de 14 slides cobrindo: consumo de GPU por nível (RTX 5090 575W a M5 Max 25–35W), tabelas de custos de eletricidade (R$280/mês vs R$13,50/mês), requisitos de fonte do sistema completo, configuração de resfriamento para limite de 83°C, limitação de potência para economizar 40%, e custos regionais (Brasil/EUA/UE/Japão/China). Baixe o PDF como cartão de referência de consumo de energia de LLM local.

Browse the slides below or download as PDF for offline reference. Download Reference Card (PDF)

Key Takeaways

  • RTX 4090: 575W sob carga, fonte de 1200W necessária. ~R$280/mês (tarifa residencial brasileira média).
  • RTX 5090: 575W TDP com 32 GB GDDR7. Mesma fonte de 1200W+.
  • Apple M5 Max: 25–35W total. 10× mais eficiente por token que NVIDIA.
  • RTX 4070: 200W TDP — a opção NVIDIA mais econômica (~R$97/mês).
  • Temperatura máxima segura: 83°C. Acima disso, o throttling reduz a velocidade em 20–40%.
  • Limitação de potência (power limit) para 80% pode economizar 20% de energia com apenas 5% de queda de desempenho.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

Consumo de energia LLM local 2026: RTX 4090 575W = R$280/mês