Skip to main content
PromptQuorumPromptQuorum
Início/LLMs locais/Calculadora de Custo de LLM Local: Montar vs Alugar 2026
Cost & Comparisons

Calculadora de Custo de LLM Local: Montar vs Alugar 2026

··By Hans Kuepper · Founder of PromptQuorum, multi-model AI dispatch tool · PromptQuorum

Para equipes que rodam LLMs mais de 4 horas por dia, montar uma workstation RTX 4090 local atinge o ponto de equilíbrio frente ao aluguel de GPU em nuvem em 12–18 meses e é mais barata no longo prazo. Abaixo de 50 horas/mês, a nuvem vence pela flexibilidade e pela ausência de custo inicial.

Key Takeaways

  • GPU em nuvem custa US$ 0,35–2,50/h conforme o nível da GPU e o provedor
  • Workstation RTX 4090 local: ~US$ 3.200 de custo total (GPU + sistema)
  • Ponto de equilíbrio: 1.800 horas acumuladas a uma tarifa média de nuvem de US$ 0,50/h
  • Mac Mini M4 Pro 48GB: US$ 2.000 de entrada, equilíbrio em ~1.200 horas de nuvem
  • A eletricidade acrescenta US$ 0,03–0,08/h aos custos operacionais locais
  • A nuvem vence para cargas de trabalho irregulares, ocasionais ou experimentais
  • O local vence para inferência diária contínua, uso com dados sensíveis ou fine-tuning
GPUVRAMProvedorSpot US$/hSob Demanda US$/h
RTX 409024 GBRunPodUS$ 0,28–0,44US$ 0,74
RTX 409024 GBVast.aiUS$ 0,32–0,48US$ 0,89
A4048 GBRunPodUS$ 0,44–0,64US$ 1,14
A100 80GB80 GBLambda LabsUS$ 1,29US$ 2,49
H100 SXM80 GBRunPodUS$ 2,39US$ 3,49
ConfiguraçãoGPUVRAMCusto TotalModelos Suportados
EconômicaRTX 3090 (usada)24 GB~US$ 1.200Até 30B Q4
RecomendadaRTX 409024 GB~US$ 3.200Até 34B Q4, 7B completo
PotênciaRTX 4090 + 309048 GB~US$ 5.000Até 70B Q4
Mac Mini M4 ProM4 Pro (unificada)48 GB~US$ 2.000Até 70B Q4 via MLX
Horas MensaisCusto Nuvem/mês (RTX 4090 @ US$ 0,50/h)Tempo para Recuperar US$ 3.200 da RTX 4090
10 h/mêsUS$ 5/mêsNunca (53 anos)
30 h/mêsUS$ 15/mês18 anos
50 h/mêsUS$ 25/mês10,7 anos
120 h/mês (4h/dia)US$ 60/mês4,4 anos
240 h/mês (8h/dia)US$ 120/mês2,2 anos
480 h/mês (16h/dia)US$ 240/mês13 meses
720 h/mês (24h/dia)US$ 360/mês9 meses

Qual é o ponto de equilíbrio de uma workstation de LLM local vs GPU em nuvem?

Uma workstation RTX 4090 (US$ 3.200 no total) atinge o equilíbrio frente a uma GPU em nuvem a US$ 0,50/h em aproximadamente 6.400 horas acumuladas. A 8 horas/dia, são 2,2 anos. A 16 horas/dia (servidor compartilhado da equipe), são 13 meses.

O custo de eletricidade afeta significativamente a comparação?

Nos EUA (12¢/kWh), a eletricidade acrescenta ~US$ 0,05/h aos custos locais — é pouco. Em regiões com energia cara, pode acrescentar mais de US$ 0,15/h, o que reduz significativamente a vantagem local. O consumo de 45 W do Mac Mini M4 Pro mantém os custos de eletricidade baixos mesmo em países com tarifas altas.

RunPod ou Vast.ai é mais barato para fine-tuning ocasional?

O Vast.ai costuma ser 10–20% mais barato que o RunPod nos preços spot, mas o RunPod tem melhor disponibilidade (uptime) e um recurso de pods gerenciados. Para uso ocasional (< 20 horas/mês), os preços spot do Vast.ai são a opção de menor custo. Para cargas de trabalho que exigem confiabilidade, o RunPod Community Cloud é a melhor escolha.

E quanto à depreciação do hardware local?

O hardware de GPU se deprecia 20–40% em 3 anos. Uma RTX 4090 comprada por US$ 1.700 pode ser revendida por US$ 900–1.200 em 2028. Levando isso em conta, o custo real do hardware local após 3 anos é (preço de compra − valor de revenda + eletricidade). Para a workstation RTX 4090: (US$ 3.200 − US$ 1.200 + US$ 180 de eletricidade a 8h/dia nos EUA) = ~US$ 2.180 em 3 anos vs. nuvem a US$ 0,50/h × 8h/dia × 365 × 3 = US$ 4.380.

Quanto custa rodar um modelo 70B localmente?

Um modelo 70B Q4_K_M requer 48 GB de VRAM/memória unificada. Opções de hardware: RTX 3090 dupla (US$ 2.000), Mac Mini M4 Pro 48 GB (US$ 2.000) ou Mac Studio M4 Max 128 GB (US$ 3.000). A eletricidade a 8h/dia nos EUA acrescenta US$ 45–90/ano. Rodar o mesmo modelo no RunPod A40 spot a 8h/dia custa ~US$ 1.300/ano.

A Note on Third-Party Facts

This article references third-party AI models, benchmarks, prices, and licenses. The AI landscape changes rapidly. Benchmark scores, license terms, model names, and API prices can shift between the time of writing and the time you read this. Before making deployment or compliance decisions based on this article, verify current figures on each provider's official source: Hugging Face model cards for licenses and benchmarks, provider websites for API pricing, and EUR-Lex for current GDPR and EU AI Act text. This article reflects publicly available information as of May 2026.

Compare your local LLM against 25+ cloud models simultaneously with PromptQuorum.

Join the PromptQuorum Waitlist →

← Back to Local LLMs

Calculadora de Custo de LLM Local 2026: Montar vs Alugar