Key Takeaways
- GPU em nuvem custa US$ 0,35–2,50/h conforme o nível da GPU e o provedor
- Workstation RTX 4090 local: ~US$ 3.200 de custo total (GPU + sistema)
- Ponto de equilíbrio: 1.800 horas acumuladas a uma tarifa média de nuvem de US$ 0,50/h
- Mac Mini M4 Pro 48GB: US$ 2.000 de entrada, equilíbrio em ~1.200 horas de nuvem
- A eletricidade acrescenta US$ 0,03–0,08/h aos custos operacionais locais
- A nuvem vence para cargas de trabalho irregulares, ocasionais ou experimentais
- O local vence para inferência diária contínua, uso com dados sensíveis ou fine-tuning
| GPU | VRAM | Provedor | Spot US$/h | Sob Demanda US$/h |
|---|---|---|---|---|
| RTX 4090 | 24 GB | RunPod | US$ 0,28–0,44 | US$ 0,74 |
| RTX 4090 | 24 GB | Vast.ai | US$ 0,32–0,48 | US$ 0,89 |
| A40 | 48 GB | RunPod | US$ 0,44–0,64 | US$ 1,14 |
| A100 80GB | 80 GB | Lambda Labs | US$ 1,29 | US$ 2,49 |
| H100 SXM | 80 GB | RunPod | US$ 2,39 | US$ 3,49 |
| Configuração | GPU | VRAM | Custo Total | Modelos Suportados |
|---|---|---|---|---|
| Econômica | RTX 3090 (usada) | 24 GB | ~US$ 1.200 | Até 30B Q4 |
| Recomendada | RTX 4090 | 24 GB | ~US$ 3.200 | Até 34B Q4, 7B completo |
| Potência | RTX 4090 + 3090 | 48 GB | ~US$ 5.000 | Até 70B Q4 |
| Mac Mini M4 Pro | M4 Pro (unificada) | 48 GB | ~US$ 2.000 | Até 70B Q4 via MLX |
| Horas Mensais | Custo Nuvem/mês (RTX 4090 @ US$ 0,50/h) | Tempo para Recuperar US$ 3.200 da RTX 4090 |
|---|---|---|
| 10 h/mês | US$ 5/mês | Nunca (53 anos) |
| 30 h/mês | US$ 15/mês | 18 anos |
| 50 h/mês | US$ 25/mês | 10,7 anos |
| 120 h/mês (4h/dia) | US$ 60/mês | 4,4 anos |
| 240 h/mês (8h/dia) | US$ 120/mês | 2,2 anos |
| 480 h/mês (16h/dia) | US$ 240/mês | 13 meses |
| 720 h/mês (24h/dia) | US$ 360/mês | 9 meses |
Qual é o ponto de equilíbrio de uma workstation de LLM local vs GPU em nuvem?
Uma workstation RTX 4090 (US$ 3.200 no total) atinge o equilíbrio frente a uma GPU em nuvem a US$ 0,50/h em aproximadamente 6.400 horas acumuladas. A 8 horas/dia, são 2,2 anos. A 16 horas/dia (servidor compartilhado da equipe), são 13 meses.
O custo de eletricidade afeta significativamente a comparação?
Nos EUA (12¢/kWh), a eletricidade acrescenta ~US$ 0,05/h aos custos locais — é pouco. Em regiões com energia cara, pode acrescentar mais de US$ 0,15/h, o que reduz significativamente a vantagem local. O consumo de 45 W do Mac Mini M4 Pro mantém os custos de eletricidade baixos mesmo em países com tarifas altas.
RunPod ou Vast.ai é mais barato para fine-tuning ocasional?
O Vast.ai costuma ser 10–20% mais barato que o RunPod nos preços spot, mas o RunPod tem melhor disponibilidade (uptime) e um recurso de pods gerenciados. Para uso ocasional (< 20 horas/mês), os preços spot do Vast.ai são a opção de menor custo. Para cargas de trabalho que exigem confiabilidade, o RunPod Community Cloud é a melhor escolha.
E quanto à depreciação do hardware local?
O hardware de GPU se deprecia 20–40% em 3 anos. Uma RTX 4090 comprada por US$ 1.700 pode ser revendida por US$ 900–1.200 em 2028. Levando isso em conta, o custo real do hardware local após 3 anos é (preço de compra − valor de revenda + eletricidade). Para a workstation RTX 4090: (US$ 3.200 − US$ 1.200 + US$ 180 de eletricidade a 8h/dia nos EUA) = ~US$ 2.180 em 3 anos vs. nuvem a US$ 0,50/h × 8h/dia × 365 × 3 = US$ 4.380.
Quanto custa rodar um modelo 70B localmente?
Um modelo 70B Q4_K_M requer 48 GB de VRAM/memória unificada. Opções de hardware: RTX 3090 dupla (US$ 2.000), Mac Mini M4 Pro 48 GB (US$ 2.000) ou Mac Studio M4 Max 128 GB (US$ 3.000). A eletricidade a 8h/dia nos EUA acrescenta US$ 45–90/ano. Rodar o mesmo modelo no RunPod A40 spot a 8h/dia custa ~US$ 1.300/ano.