Key Takeaways

GPU em nuvem custa US$ 0,35–2,50/h conforme o nível da GPU e o provedor
Workstation RTX 4090 local: ~US$ 3.200 de custo total (GPU + sistema)
Ponto de equilíbrio: 1.800 horas acumuladas a uma tarifa média de nuvem de US$ 0,50/h
Mac Mini M4 Pro 48GB: US$ 2.000 de entrada, equilíbrio em ~1.200 horas de nuvem
A eletricidade acrescenta US$ 0,03–0,08/h aos custos operacionais locais
A nuvem vence para cargas de trabalho irregulares, ocasionais ou experimentais
O local vence para inferência diária contínua, uso com dados sensíveis ou fine-tuning

GPU	VRAM	Provedor	Spot US$/h	Sob Demanda US$/h
RTX 4090	24 GB	RunPod	US$ 0,28–0,44	US$ 0,74
RTX 4090	24 GB	Vast.ai	US$ 0,32–0,48	US$ 0,89
A40	48 GB	RunPod	US$ 0,44–0,64	US$ 1,14
A100 80GB	80 GB	Lambda Labs	US$ 1,29	US$ 2,49
H100 SXM	80 GB	RunPod	US$ 2,39	US$ 3,49

Configuração	GPU	VRAM	Custo Total	Modelos Suportados
Econômica	RTX 3090 (usada)	24 GB	~US$ 1.200	Até 30B Q4
Recomendada	RTX 4090	24 GB	~US$ 3.200	Até 34B Q4, 7B completo
Potência	RTX 4090 + 3090	48 GB	~US$ 5.000	Até 70B Q4
Mac Mini M4 Pro	M4 Pro (unificada)	48 GB	~US$ 2.000	Até 70B Q4 via MLX

Horas Mensais	Custo Nuvem/mês (RTX 4090 @ US$ 0,50/h)	Tempo para Recuperar US$ 3.200 da RTX 4090
10 h/mês	US$ 5/mês	Nunca (53 anos)
30 h/mês	US$ 15/mês	18 anos
50 h/mês	US$ 25/mês	10,7 anos
120 h/mês (4h/dia)	US$ 60/mês	4,4 anos
240 h/mês (8h/dia)	US$ 120/mês	2,2 anos
480 h/mês (16h/dia)	US$ 240/mês	13 meses
720 h/mês (24h/dia)	US$ 360/mês	9 meses

Qual é o ponto de equilíbrio de uma workstation de LLM local vs GPU em nuvem?

Uma workstation RTX 4090 (US$ 3.200 no total) atinge o equilíbrio frente a uma GPU em nuvem a US$ 0,50/h em aproximadamente 6.400 horas acumuladas. A 8 horas/dia, são 2,2 anos. A 16 horas/dia (servidor compartilhado da equipe), são 13 meses.

O custo de eletricidade afeta significativamente a comparação?

Nos EUA (12¢/kWh), a eletricidade acrescenta ~US$ 0,05/h aos custos locais — é pouco. Em regiões com energia cara, pode acrescentar mais de US$ 0,15/h, o que reduz significativamente a vantagem local. O consumo de 45 W do Mac Mini M4 Pro mantém os custos de eletricidade baixos mesmo em países com tarifas altas.

RunPod ou Vast.ai é mais barato para fine-tuning ocasional?

O Vast.ai costuma ser 10–20% mais barato que o RunPod nos preços spot, mas o RunPod tem melhor disponibilidade (uptime) e um recurso de pods gerenciados. Para uso ocasional (< 20 horas/mês), os preços spot do Vast.ai são a opção de menor custo. Para cargas de trabalho que exigem confiabilidade, o RunPod Community Cloud é a melhor escolha.

E quanto à depreciação do hardware local?

O hardware de GPU se deprecia 20–40% em 3 anos. Uma RTX 4090 comprada por US$ 1.700 pode ser revendida por US$ 900–1.200 em 2028. Levando isso em conta, o custo real do hardware local após 3 anos é (preço de compra − valor de revenda + eletricidade). Para a workstation RTX 4090: (US$ 3.200 − US$ 1.200 + US$ 180 de eletricidade a 8h/dia nos EUA) = ~US$ 2.180 em 3 anos vs. nuvem a US$ 0,50/h × 8h/dia × 365 × 3 = US$ 4.380.

Quanto custa rodar um modelo 70B localmente?

Um modelo 70B Q4_K_M requer 48 GB de VRAM/memória unificada. Opções de hardware: RTX 3090 dupla (US$ 2.000), Mac Mini M4 Pro 48 GB (US$ 2.000) ou Mac Studio M4 Max 128 GB (US$ 3.000). A eletricidade a 8h/dia nos EUA acrescenta US$ 45–90/ano. Rodar o mesmo modelo no RunPod A40 spot a 8h/dia custa ~US$ 1.300/ano.

Calculadora de Custo de LLM Local: Montar vs Alugar 2026

Qual é o ponto de equilíbrio de uma workstation de LLM local vs GPU em nuvem?

O custo de eletricidade afeta significativamente a comparação?

RunPod ou Vast.ai é mais barato para fine-tuning ocasional?

E quanto à depreciação do hardware local?

Quanto custa rodar um modelo 70B localmente?

A Note on Third-Party Facts