Key Takeaways
- Cloud GPU cuesta 0,35–2,50 $/hr según el nivel de GPU y el proveedor
- Workstation RTX 4090 local: ~3.200 $ de costo total (GPU + sistema)
- Punto de equilibrio: 1.800 horas acumuladas a 0,50 $/hr de tarifa cloud media
- Mac Mini M4 Pro 48GB: 2.000 $ de entrada, equilibrio en ~1.200 horas cloud
- La electricidad añade 0,03–0,08 $/hr a los costos operativos locales
- El cloud gana para cargas de trabajo esporádicas, ocasionales o experimentales
- Lo local gana para inferencia diaria sostenida, uso con datos sensibles o fine-tuning
¿Cuál es el punto de equilibrio de una workstation LLM local vs GPU cloud?
Una workstation RTX 4090 ($3.200 en total) alcanza el equilibrio frente a GPU cloud a $0,50/hr en aproximadamente 6.400 horas acumuladas. A 8 horas/día, son 2,2 años. A 16 horas/día (servidor compartido de equipo), son 13 meses.
¿El costo de electricidad afecta significativamente la comparación?
En EE.UU. (12¢/kWh), la electricidad añade ~$0,05/hr a los costos locales — es menor. En Alemania (38¢/kWh), añade ~$0,16/hr, lo que reduce de forma significativa la ventaja local. El consumo de 45 W del Mac Mini M4 Pro mantiene los costos de electricidad bajos incluso en países con tarifas altas.
¿Es RunPod o Vast.ai más barato para fine-tuning ocasional?
Vast.ai suele ser un 10–20 % más barato que RunPod en precios spot, pero RunPod tiene mejor tiempo de actividad y una función de pods gestionados. Para uso ocasional (< 20 horas/mes), los precios spot de Vast.ai son la opción de menor costo. Para cargas de trabajo que requieren fiabilidad, RunPod Community Cloud es la mejor opción.
¿Qué pasa con la depreciación del hardware local?
El hardware GPU se deprecia un 20–40 % en 3 años. Una RTX 4090 comprada a $1.700 puede revenderse por $900–1.200 en 2028. Teniendo esto en cuenta, el costo real del hardware local tras 3 años es (precio de compra − valor de reventa + electricidad). Para la workstation RTX 4090: ($3.200 − $1.200 + $180 electricidad a 8hr/día en EE.UU.) = ~$2.180 en 3 años vs. cloud a $0,50/hr × 8hr/día × 365 × 3 = $4.380.
¿Cuánto cuesta ejecutar un modelo 70B localmente?
Un modelo 70B Q4_K_M requiere 48 GB de VRAM/memoria unificada. Opciones de hardware: RTX 3090 dual ($2.000), Mac Mini M4 Pro 48 GB ($2.000) o Mac Studio M4 Max 128 GB ($3.000). La electricidad a 8hr/día en EE.UU. añade $45–90/año. Ejecutar el mismo modelo en RunPod A40 spot a 8hr/día cuesta ~$1.300/año.