Início/LLMs locais/Consumo de Energia de LLMs Locais 2026: RTX 4090, RTX 5090 e M5 Max Comparados

Hardware & Performance

Consumo de Energia de LLMs Locais 2026: RTX 4090, RTX 5090 e M5 Max Comparados

Last updated: 4 de abril de 2026·10 min de leitura·By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

Ler em:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

RTX 4090: 575W sob carga, ~R$280/mês (tarifa residencial média brasileira de R$0,90/kWh). RTX 5090: 575W com 32 GB GDDR7. Apple M5 Max: 30W total (10× mais eficiente por token que NVIDIA). Planeje a fonte de alimentação: RTX 4090/5090 exige fonte de 1200W+.

Executar LLMs locais consome uma quantidade significativa de energia. A RTX 4090 consome 575W sob carga (fonte de 1200W necessária, ~R$280/mês a R$0,90/kWh tarifa residencial média brasileira). A RTX 5090 consome 575W com 32 GB de VRAM GDDR7. Apple M5 Max executa modelos 7B com apenas 30W no total — 10× mais eficiente energeticamente por token que a NVIDIA. A partir de abril de 2026, entender os requisitos de energia evita danos ao hardware e ajuda a planejar os custos de eletricidade.

Slide Deck: Consumo de Energia de LLMs Locais 2026: RTX 4090, RTX 5090 e M5 Max Comparados

Apresentação interativa de 14 slides cobrindo: consumo de GPU por nível (RTX 5090 575W a M5 Max 25–35W), tabelas de custos de eletricidade (R$280/mês vs R$13,50/mês), requisitos de fonte do sistema completo, configuração de resfriamento para limite de 83°C, limitação de potência para economizar 40%, e custos regionais (Brasil/EUA/UE/Japão/China). Baixe o PDF como cartão de referência de consumo de energia de LLM local.

Browse the slides below or download as PDF for offline reference. Download Reference Card (PDF)

Key Takeaways

RTX 4090: 575W sob carga, fonte de 1200W necessária. ~R$280/mês (tarifa residencial brasileira média).
RTX 5090: 575W TDP com 32 GB GDDR7. Mesma fonte de 1200W+.
Apple M5 Max: 25–35W total. 10× mais eficiente por token que NVIDIA.
RTX 4070: 200W TDP — a opção NVIDIA mais econômica (~R$97/mês).
Temperatura máxima segura: 83°C. Acima disso, o throttling reduz a velocidade em 20–40%.
Limitação de potência (power limit) para 80% pode economizar 20% de energia com apenas 5% de queda de desempenho.

Nota sobre informações de terceiros

Este artigo faz referência a modelos de IA, benchmarks, preços e licenças de terceiros. O cenário da IA muda rapidamente. Pontuações de benchmark, termos de licença, nomes de modelos e preços de API podem mudar entre o momento em que foi escrito e quando você está lendo. Antes de tomar decisões de implantação ou conformidade com base neste artigo, verifique os dados atuais na fonte oficial de cada fornecedor: fichas de modelos do Hugging Face para licenças e benchmarks, sites dos fornecedores para preços de API e EUR-Lex para o texto atual do GDPR e da Lei de IA da UE. Este artigo reflete informações publicamente disponíveis em maio de 2026.

Run PromptQuorum with a local LLM, your own API keys, or both — you pick the backend.

Join the PromptQuorum Waitlist →

← Back to Local LLMs