Wichtigste Erkenntnisse
- Der Zuverlässigkeitsbedarf ist der bindende Engpass, nicht der Stundensatz. Ein günstiger Satz, der mitten im Auftrag unterbrochen wird, kostet mehr als ein stabiler Satz, der zu Ende läuft. Wählen Sie den Anbieter, dessen Verfügbarkeitsgarantie zum Auftrag passt, und optimieren Sie erst dann den Preis.
- Die tatsächlichen Kosten sind Satz mal Laufzeit plus verlorene Stunden. Die meisten Anbieter rechnen sekundengenau ab, daher kann ein Auftrag, der auf einer günstigeren, aber langsamer startenden Instanz doppelt so lange läuft, dasselbe kosten — vergleichen Sie die Gesamtkosten des Auftrags, nicht den Listenpreis.
- Ausgewogene Standardwahl: RunPod (~$0.34-0.69/Std. RTX 4090) — eine Secure-Cloud-Stufe mit 99 % Verfügbarkeit, 5-minütige Einrichtung, $10 Startguthaben und EU-Regionen. Die sicherste erste Wahl für die meisten Käufer.
- Günstigste: Vast.ai (~$0.09-0.59/Std. RTX 4090) — ein Peer-to-Peer-Marktplatz, 30-50 % unter den Wettbewerbern. Kein Verfügbarkeits-SLA; Spot-Instanzen können mit 15 Sekunden Vorankündigung zurückgefordert werden.
- Zuverlässigste: Lambda Labs ($1.79/Std. A100, $2.99/Std. H100) — ein SLA von 99,9 % Verfügbarkeit, Live-Support per Slack und Telefon sowie das ausgefeilteste Onboarding. Mit Premium-Preis und nur in den USA.
- Die EU-Datenresidenz teilt das Feld. RunPod hat EU-Rechenzentren (Niederlande, Rumänien) und kann einen AV-Vertrag abschließen. Lambda Labs ist nur in den USA; der Hoststandort von Vast.ai variiert und ist nicht zuverlässig konform.
- Mieten schlägt Kaufen bei gelegentlichem Rechenbedarf. Cloud-GPU-Miete ist rund 30-50 % günstiger als der Besitz von Hardware, wenn Sie wöchentliche Fine-Tuning-Läufe oder Lastspitzen statt 24/7-Inferenz benötigen.
- Mit kostenlosem Guthaben können Sie vor der Festlegung testen. RunPod gibt $10, Lambda Labs $15, Vast.ai etwa $5 — genug, um Ihre eigene Arbeitslast bei jedem Anbieter zu benchmarken, bevor Sie sich entscheiden.
Kurzfakten
- Günstigste Stufe: Vast.ai Spot-RTX 4090 ab ~$0.09/Std. (Median rund $0.21/Std.) — variabel, unterbrechbar.
- Ausgewogene Stufe: RunPod RTX 4090 ~$0.34-0.69/Std., A100 80GB ~$1.79/Std., 99 % Verfügbarkeits-SLA.
- Premium-Stufe: Lambda Labs A100 80GB $1.79/Std., H100 80GB $2.99/Std., 99,9 % Verfügbarkeits-SLA.
- Abrechnungsgranularität: RunPod und Vast.ai rechnen sekundengenau ab; Lambda Labs rechnet minutengenau ab.
- Einrichtungszeit: Lambda Labs ~3 Minuten, RunPod ~5 Minuten, Vast.ai ~10 Minuten.
- Kostenloses Registrierungsguthaben: RunPod $10, Lambda Labs $15, Vast.ai ~$5 (je nach Aktion).
- Preisrealität 2026: Cloud-GPU-Sätze ändern sich von Woche zu Woche; die Spot-Preise von Vast.ai ändern sich minütlich — bestätigen Sie den Live-Satz.
Empfehlung der Redaktion: RunPod
Für die meisten Käufer, die eine Cloud-GPU für lokale LLM-Arbeit mieten, ist RunPod die Wahl, die Preis, Zuverlässigkeit und Einrichtungsaufwand in Einklang bringt. Die Secure-Cloud-Stufe bietet eine Verfügbarkeitsgarantie von 99 % bei rund $0.34-0.69/Std. für eine RTX 4090, die Einrichtung dauert etwa 5 Minuten, und ein Startguthaben von $10 deckt einen echten Testlauf ab. RunPod hat zudem EU-Rechenzentren und kann einen Auftragsverarbeitungsvertrag abschließen, was Lambda Labs und Vast.ai nicht zuverlässig leisten können. Wählen Sie Vast.ai nur, wenn Ihr Auftrag Unterbrechungen verträgt und Sie den niedrigstmöglichen Satz wünschen; wählen Sie Lambda Labs nur, wenn ein Team ein hartes SLA von 99,9 % und Live-Support benötigt. Für alle anderen ist RunPod die sichere Standardwahl.
📌Note: Diese Empfehlung der Redaktion spiegelt ausschließlich das Preis-Leistungs-Verhältnis wider. PromptQuorum ist an keinem Partnerprogramm beteiligt, und die untenstehenden Links tragen keine Affiliate-Kennungen — es sind reine Referenzlinks, die keine Provision erzielen.
Wie RunPod, Lambda Labs und Vast.ai 2026 abschneiden
Die Angaben zu Preisen, Verfügbarkeit und Funktionen sind Momentaufnahmen vom Mai 2026 von jedem Anbieter, abgeglichen mit dem PromptQuorum-Cloud-GPU-Vergleich. Cloud-GPU-Sätze ändern sich von Woche zu Woche, und die Spot-Sätze von Vast.ai ändern sich minütlich — prüfen Sie den Live-Satz vor einer Festlegung erneut. RTX-4090-Sätze eignen sich für 8B-34B-Inferenz; A100- und H100-Sätze eignen sich für 70B- und Fine-Tuning-Arbeit. Alle Preise bleiben in USD, da Anbieter weltweit in USD abrechnen.
📍 In einem Satz
Bei der Cloud-GPU-Miete entscheidet die Verfügbarkeitsgarantie eines Anbieters, ob Ihr Auftrag zu Ende läuft, und der Stundensatz entscheidet, was das kostet — wählen Sie nach dem Ersten und optimieren Sie dann das Zweite.
💬 In einfachen Worten
Stellen Sie es sich vor wie das Buchen eines Taxis im Vergleich zu einem Fahrdienst bei Spitzenpreisen. Die günstige Option storniert vielleicht auf halbem Weg; die teure bringt Sie garantiert ans Ziel. Wenn die Fahrt abgeschlossen werden muss, zahlen Sie für die Garantie; wenn Sie einfach neu buchen können, nehmen Sie die günstige Fahrt.
| Anbieter | RTX 4090 | A100 80GB | H100 80GB | Verfügbarkeits-SLA | Einrichtung | EU-Region |
|---|---|---|---|---|---|---|
| RunPod | ~$0.34-0.69/Std. | ~$1.79/Std. | ~$2.69/Std. | 99 % | ~5 Min. | Ja (NL, RO) |
| Lambda Labs | Nicht angeboten | $1.79/Std. | $2.99/Std. | 99,9 % | ~3 Min. | Nein (nur USA) |
| Vast.ai | ~$0.09-0.59/Std. | ~$1.00-1.80/Std. | ~$1.49-1.87/Std. | Keines | ~10 Min. | Je nach Host |
Welchen Anbieter sollten Sie wählen?
Ihr Zuverlässigkeitsbedarf entscheidet über den Anbieter; Ihr Budget entscheidet über die GPU-Stufe darin. Finden Sie die Zeile, die zu Ihrer Situation passt.
| Ihre Situation | Das sollten Sie wählen |
|---|---|
| Ich möchte die sicherste Standardwahl und ein Gleichgewicht aus Preis und Zuverlässigkeit | RunPod (Secure Cloud) |
| Ich führe unterbrechbare Aufträge aus und möchte den niedrigstmöglichen Satz | Vast.ai (Spot-Instanzen) |
| Mein Team benötigt eine harte Verfügbarkeitsgarantie von 99,9 % und Live-Support | Lambda Labs |
| Ich verarbeite personenbezogene EU-Daten und benötige DSGVO-Datenresidenz | RunPod (EU-Regionen) |
| Ich möchte vor der Festlegung viele GPU-Typen testen | Vast.ai (größter Katalog) |
| Ich führe stabile Fine-Tuning-Aufträge aus, die nicht unterbrochen werden dürfen | RunPod Secure Cloud oder Lambda Labs |
| Ich bin Einsteiger und möchte das einfachste Onboarding | Lambda Labs (oder RunPod) |
| Ich bin unsicher und möchte die sicherste erste Wahl | RunPod — $10 kostenloses Guthaben, am flexibelsten |
RunPod: Die ausgewogene Standardwahl
RunPod ist die ausgewogene Standardwahl — ein verwalteter Marktplatz mit einer stabilen Secure-Cloud-Stufe und einer günstigeren, unterbrechbaren On-Demand-Stufe. Für die meisten Käufer ist es die richtige erste Wahl: vorhersehbare Preise, schnelle Einrichtung und der einzige der drei mit nutzbarer EU-Datenresidenz.
- RTX 4090 (~$0.34-0.69/Std.): eignet sich für 8B-34B-Inferenz. Die Secure-Cloud-Stufe bietet eine Verfügbarkeitsgarantie von 99 % und wird nicht unterbrochen; die On-Demand-Stufe ist günstiger, kann aber mit 5 Minuten Vorankündigung zurückgefordert werden.
- A100 80GB (~$1.79/Std.) und H100 80GB (~$2.69/Std.): für 70B-Inferenz und Fine-Tuning. Die 80 GB VRAM fassen ein 70B-Modell, das eine RTX 4090 mit 24 GB nicht bewältigt.
- Einrichtung und Abrechnung: etwa 5 Minuten von der Registrierung bis zur laufenden Instanz, sekundengenaue Abrechnung ohne Stundenmindestbetrag, eigene Docker-Images und ML-Vorlagen mit einem Klick.
- Warum RunPod wählen: Sie möchten ein Gleichgewicht aus Preis und Zuverlässigkeit, Sie benötigen EU-Datenresidenz (Rechenzentren in den Niederlanden und Rumänien, AV-Vertrag verfügbar) oder Sie möchten die sicherste Standardwahl.
- Warum RunPod überspringen: Wenn Ihr Auftrag Unterbrechungen verträgt und Sie den absolut niedrigsten Satz wünschen, ist Vast.ai günstiger; wenn Sie ein hartes SLA von 99,9 % benötigen, garantiert Lambda Labs mehr.
💡Tip: Nutzen Sie die Secure-Cloud-Stufe für jeden Auftrag, der zu Ende laufen muss — Fine-Tuning-Läufe, Batch-Inferenz. Nutzen Sie die günstigere On-Demand-Stufe nur für Aufträge, die Sie per Checkpoint speichern und fortsetzen können, falls die Instanz zurückgefordert wird.
Lambda Labs: Die zuverlässige Wahl
Lambda Labs ist die zuverlässige Wahl — eine verwaltete Cloud mit Fokus auf Verfügbarkeit, Support und Enterprise-GPUs der Typen A100/H100. Sie kostet mehr als RunPod oder Vast.ai, doch der Aufpreis erkauft ein SLA von 99,9 % und Live-Support durch Menschen, was Produktionsarbeitslasten oft benötigen.
- A100 80GB ($1.79/Std.) und H100 80GB ($2.99/Std.): das Kernangebot, ausgerichtet auf 70B-Inferenz, Fine-Tuning und verteiltes Training. Lambda Labs bietet die Consumer-RTX 4090 nicht an — das ist Absicht.
- Zuverlässigkeit und Support: ein Verfügbarkeits-SLA von 99,9 %, Live-Support über Slack, E-Mail und Telefon sowie das ausgefeilteste Onboarding der drei (etwa 3 Minuten bis zur laufenden Instanz).
- Abrechnung und Guthaben: minutengenaue Abrechnung, ein Registrierungsguthaben von $15, Rabatte für reservierte Instanzen bei langfristigen Zusagen sowie Team-Konten für mehrere Nutzer.
- Warum Lambda Labs wählen: Ihr Team benötigt eine harte Verfügbarkeitsgarantie, Sie führen Produktionsinferenz aus, die keine Unterbrechung verträgt, oder Sie möchten Live-Support statt eines Community-Forums.
- Warum Lambda Labs überspringen: Für Experimente ist es die teuerste Option, es gibt keine RTX-4090-Stufe für günstige Arbeit mit kleinen Modellen, und die Infrastruktur befindet sich ausschließlich in den USA — sie eignet sich nicht für personenbezogene EU-Daten.
⚠️Warning: Die Infrastruktur von Lambda Labs befindet sich ausschließlich in den USA, ohne EU-Regionen. Wenn Sie personenbezogene EU-Daten über Ihre LLM-Arbeitslast verarbeiten, ist Lambda Labs für diese Daten nicht DSGVO-konform — nutzen Sie stattdessen die EU-Regionen von RunPod oder einen EU-eigenen Anbieter.
Vast.ai: Die günstige Wahl
Vast.ai ist die günstige Wahl — ein Peer-to-Peer-Marktplatz, auf dem Privatpersonen und Rechenzentren freie GPU-Kapazität 30-50 % unter den verwalteten Anbietern vermieten. Die Ersparnis ist real, ebenso aber die Variabilität: Es gibt keine Verfügbarkeitsgarantie, und Spot-Instanzen können mit 15 Sekunden Vorankündigung zurückgefordert werden.
- RTX 4090 (~$0.09-0.59/Std., Median rund $0.21/Std.): der günstigste RTX-4090-Satz der drei. Der Wert von $0.09/Std. ist real, aber selten; kalkulieren Sie mit dem Median, nicht mit dem Tiefstwert.
- A100 80GB (~$1.00-1.80/Std.) und H100 (~$1.49-1.87/Std.): ebenfalls unter den Sätzen von RunPod und Lambda Labs. Vast.ai hat den größten Katalog — über 500 verschiedene GPU-Modelle.
- Die Kompromisse: kein Verfügbarkeits-SLA, Spot-Unterbrechungen mit 15 Sekunden Vorankündigung, schwankende Host-Qualität, kein garantierter Root-Zugriff und eine technischere Einrichtung (etwa 10 Minuten).
- Warum Vast.ai wählen: Ihr Auftrag verträgt Unterbrechungen und kann per Checkpoint speichern, Sie möchten den niedrigstmöglichen Satz oder Sie möchten einen ungewöhnlichen GPU-Typ vor dem Kauf testen.
- Warum Vast.ai überspringen: Wenn der Auftrag termingerecht zu Ende laufen muss, wenn Sie eine Zuverlässigkeitsgarantie benötigen oder wenn Sie personenbezogene EU-Daten verarbeiten — der Hoststandort variiert, und es gibt keinen zentralen AV-Vertrag.
💡Tip: Für einen Auftrag, der nicht unterbrochen werden darf, nutzen Sie den Filter „Interruptible: Off" auf Vast.ai — er liefert stabile Instanzen zu einem höheren Preis. Wenn Sie dennoch eine Garantie benötigen, ist RunPod Secure Cloud die sicherere Wahl.
Sollten Sie mieten oder kaufen?
Mieten Sie, wenn Ihr Rechenbedarf gelegentlich ist; kaufen Sie, wenn er konstant ist. Cloud-GPU-Miete ist bei stoßweisen Arbeitslasten rund 30-50 % günstiger als der Besitz von Hardware, doch ein 24/7-Inferenzserver kippt zugunsten eigener Hardware.
📍 In einem Satz
Mieten Sie Cloud-GPUs für gelegentliche oder stoßweise KI-Rechenarbeit und kaufen Sie Hardware für stetige 24/7-Inferenz, denn eine dauerhaft gemietete GPU kostet auf Dauer mehr als eine eigene.
💬 In einfachen Worten
Mieten ist wie ein Hotel und Kaufen wie ein Haus. Für ein paar Nächte im Jahr ist das Hotel weit günstiger. Wohnen Sie jede Nacht dort, hätten Sie das Haus kaufen sollen. Passen Sie die Wahl daran an, wie oft Sie die Rechenleistung tatsächlich benötigen.
- Mieten, wenn: Sie wöchentliche Fine-Tuning-Läufe benötigen, Sie eine Hardwareausgabe von $2,000-10,000 vermeiden möchten, Sie mehrere GPU-Typen zum Experimentieren benötigen oder Sie kurzzeitig viele GPUs für verteiltes Training benötigen.
- Kaufen, wenn: Sie Inferenz rund um die Uhr ausführen, Ihre Arbeitslast stetig und vorhersehbar ist oder Ihre Daten Ihre eigene Hardware niemals verlassen dürfen. Eine ständig laufende gemietete GPU kostet auf Dauer mehr als der Besitz einer eigenen.
- Der Umschlagpunkt: Eine RTX 4090, gemietet zu rund $0.40/Std., kostet bei Dauerbetrieb etwa $3,500 pro Jahr — nahe am Direktkauf der Karte, und Sie zahlen jedes Folgejahr weiter.
- Der Hybridweg: Viele Teams besitzen einen Mac oder eine günstige GPU für die tägliche Inferenz und mieten A100/H100-Kapazität nur für gelegentliches Fine-Tuning. Das hält die laufenden Kosten niedrig und die Spitzenkosten variabel.
Entscheidungsdiagramm: Wählen Sie Ihren Anbieter in vier Fragen
Vier Fragen, in dieser Reihenfolge, leiten die meisten Käufer zu einem Anbieter.
📍 In einem Satz
Wählen Sie einen Cloud-GPU-Anbieter, indem Sie zuerst die Unterbrechungstoleranz, zweitens die EU-Datenresidenz, drittens den GPU-Typ und zuletzt die Preissensibilität beantworten.
💬 In einfachen Worten
Beginnen Sie damit, ob der Auftrag eine Unterbrechung überstehen kann, prüfen Sie dann, ob Ihre Daten in der EU bleiben müssen, wählen Sie dann die GPU, die Ihr Modell benötigt, und vergleichen Sie erst danach die Sätze. Mit dem Preis zu beginnen ist der Weg, eine günstige Instanz zu wählen, die den Auftrag verliert.
- 1. Muss der Auftrag ohne Unterbrechung zu Ende laufen? Ja, mit harter Garantie: Lambda Labs (99,9 %). Ja, aber 99 % genügen: RunPod Secure Cloud. Nein, er kann per Checkpoint speichern und fortsetzen: Vast.ai.
- 2. Verarbeiten Sie personenbezogene EU-Daten? Ja: RunPod EU-Regionen oder ein EU-eigener Anbieter — nicht Lambda Labs oder Vast.ai. Nein: jeder Anbieter.
- 3. Welche GPU benötigen Sie? RTX 4090 für 8B-34B-Inferenz: RunPod oder Vast.ai. A100 oder H100 für 70B und Fine-Tuning: jeder der drei.
- 4. Wie preissensibel sind Sie? Niedrigster Satz und Unterbrechung ist akzeptabel: Vast.ai. Gleichgewicht aus Preis und Stabilität: RunPod. Preis ist Zuverlässigkeit nachgeordnet: Lambda Labs.
Wo Sie sich registrieren
Jeder Anbieter hat eine direkte Registrierungsseite mit kostenlosem Startguthaben — genug, um Ihre eigene Arbeitslast vor der Festlegung zu benchmarken. Die untenstehenden Links sind reine Anbieterlinks; sie tragen keine Affiliate-Kennungen und erzielen keine Provision.
- RunPod (runpod.io): $10 Registrierungsguthaben, sofortiger Zugriff auf Secure-Cloud- und On-Demand-Stufen, EU-Regionen bei der Registrierung verfügbar.
- Lambda Labs (lambdalabs.com): $15 Registrierungsguthaben, das ausgefeilteste Onboarding, Optionen für reservierte Instanzen bei langfristigen Zusagen.
- Vast.ai (vast.ai): rund $5 Startguthaben (je nach Aktion), der größte GPU-Katalog, aber eine technischere Einrichtung — rechnen Sie mit etwa 10 Minuten.
- Testen Sie vor der Festlegung: Führen Sie Ihr tatsächliches Modell mit dem kostenlosen Guthaben jedes Anbieters aus und messen Sie die Gesamtkosten des Auftrags, nicht den Listenpreis, bevor Sie sich entscheiden.
⚠️Warning: Cloud-GPU-Sätze sind eine schnelllebige Momentaufnahme vom Mai 2026. Insbesondere die Spot-Preise von Vast.ai ändern sich minütlich. Öffnen Sie stets die Live-Preisseite des Anbieters, bevor Sie sich auf einen langen Auftrag oder eine reservierte Instanz festlegen.
Häufige Fehler beim Mieten einer Cloud-GPU
- Den niedrigsten Satz wählen, ohne die Verfügbarkeitsgarantie zu prüfen. Eine günstige Instanz, die mitten im Auftrag zurückgefordert wird, verliert die Arbeit. Bestätigen Sie, dass die Zuverlässigkeitsstufe zum Auftrag passt, bevor Sie Sätze vergleichen.
- Listenpreise statt Gesamtkosten des Auftrags vergleichen. Die meisten Anbieter rechnen sekundengenau ab. Eine langsamer startende Instanz kann lange genug laufen, um ihren niedrigeren Satz aufzuzehren — vergleichen Sie Satz mal Laufzeit.
- Instanzen im Leerlauf weiterlaufen lassen. Eine vergessene laufende Instanz wird rund um die Uhr abgerechnet. Pausieren oder beenden Sie Instanzen in dem Moment, in dem ein Auftrag fertig ist.
- Die Datenresidenz für personenbezogene EU-Daten ignorieren. Lambda Labs ist nur in den USA, und der Hoststandort von Vast.ai variiert — keiner ist zuverlässig DSGVO-konform. Nutzen Sie die EU-Regionen von RunPod oder einen EU-eigenen Anbieter für personenbezogene EU-Daten.
- 24/7 mieten, wenn Kaufen günstiger wäre. Eine dauerhaft gemietete RTX 4090 kostet rund $3,500 pro Jahr — nahe am Preis für den Besitz der Karte. Mieten Sie für Lastspitzen, kaufen Sie für stetige Last.
- Den Test mit dem kostenlosen Guthaben überspringen. RunPod, Lambda Labs und Vast.ai geben alle ein Registrierungsguthaben. Benchmarken Sie Ihr eigenes Modell bei jedem, bevor Sie echtes Geld einsetzen.
- Root-Zugriff bei Vast.ai voraussetzen. Root-Zugriff ist auf Peer-to-Peer-Hosts nicht garantiert. Prüfen Sie die Instanzdetails vor der Miete, wenn Ihr Setup sudo benötigt.
Quellen
- RunPod Pricing — Offizielle RunPod-Stundensätze für Secure Cloud und On-Demand für RTX 4090, A100 und H100, verwendet für die Momentaufnahme vom Mai 2026.
- Lambda Labs GPU Cloud Pricing — Offizielle On-Demand-Sätze von Lambda Labs für A100 und H100 sowie das Verfügbarkeits-SLA.
- Vast.ai Pricing and Marketplace — Spot- und On-Demand-Marktplatzsätze von Vast.ai, verwendet für die Bereiche von RTX 4090, A100 und H100 vom Mai 2026.
- Cloud GPU Rental Comparison 2026 — PromptQuorum-Tests: Anbieterpreise, Verfügbarkeit, Einrichtungszeit und Analyse der DSGVO-Datenresidenz, monatlich verifiziert.
FAQ
Welcher Cloud-GPU-Anbieter ist 2026 am günstigsten?
Vast.ai ist am günstigsten. Die Peer-to-Peer-Spot-Preise für eine RTX 4090 reichen von etwa $0.09 bis $0.59 pro Stunde, mit einem Median von rund $0.21 pro Stunde — rund 30-50 % unter RunPod und Lambda Labs. Der Kompromiss ist die fehlende Verfügbarkeitsgarantie und Spot-Unterbrechungen mit 15 Sekunden Vorankündigung. RunPod ist der günstigste Anbieter, der dennoch eine Zuverlässigkeitsgarantie bietet.
Welcher Cloud-GPU-Anbieter ist am zuverlässigsten?
Lambda Labs ist am zuverlässigsten, mit einem Verfügbarkeits-SLA von 99,9 % und Live-Support durch Menschen über Slack, E-Mail und Telefon. RunPod Secure Cloud folgt dicht dahinter mit einem SLA von 99 % zu einem niedrigeren Preis. Vast.ai hat überhaupt keine Verfügbarkeitsgarantie — es ist ein Peer-to-Peer-Marktplatz, daher hängt die Zuverlässigkeit vom einzelnen Host ab.
Ist es günstiger, eine GPU für KI zu mieten oder zu kaufen?
Mieten Sie, wenn Ihr Rechenbedarf gelegentlich ist — Cloud-Miete ist bei wöchentlichen Fine-Tuning-Läufen oder Lastspitzen rund 30-50 % günstiger als der Besitz von Hardware. Kaufen Sie, wenn Sie Inferenz rund um die Uhr ausführen: Eine dauerhaft gemietete RTX 4090 zu etwa $0.40 pro Stunde kostet rund $3,500 pro Jahr, nahe am Preis für den Besitz der Karte, und Sie zahlen jedes Jahr weiter.
Welche Cloud-GPU-Anbieter sind DSGVO-konform?
RunPod hat EU-Rechenzentren in den Niederlanden und Rumänien und kann einen Auftragsverarbeitungsvertrag abschließen, was es für personenbezogene EU-Daten nutzbar macht. Lambda Labs ist nur in den USA, ohne EU-Regionen. Der Hoststandort von Vast.ai variiert, und es gibt keinen zentralen AV-Vertrag. Nutzen Sie für personenbezogene EU-Daten die EU-Regionen von RunPod oder einen EU-eigenen Anbieter.
Wie schnell kann ich eine Cloud-GPU in Betrieb nehmen?
Lambda Labs ist am schnellsten mit etwa 3 Minuten von der Registrierung bis zur laufenden Instanz, dank des ausgefeiltesten Onboardings. RunPod benötigt etwa 5 Minuten. Vast.ai benötigt rund 10 Minuten, weil der Peer-to-Peer-Marktplatz technisch anspruchsvoller zu bedienen ist. Alle drei geben kostenloses Registrierungsguthaben, damit Sie die Einrichtung kostenlos testen können.
Welche GPU benötige ich, um ein 70B-Modell in der Cloud auszuführen?
Mieten Sie für ein 70B-Modell eine A100 80GB oder H100 80GB. Ein 70B-Modell mit Q4 benötigt rund 39-42 GB VRAM, was die 24 GB einer Cloud-RTX 4090 übersteigt. RunPod und Vast.ai bieten beide A100- und H100-Instanzen; Lambda Labs bietet A100 und H100 und ist genau um diese Enterprise-GPU-Stufe herum aufgebaut.
Was passiert, wenn meine Vast.ai-Spot-Instanz unterbrochen wird?
Eine Vast.ai-Spot-Instanz kann vom Host mit 15 Sekunden Vorankündigung zurückgefordert werden, und nicht gespeicherte laufende Arbeit geht verloren. Speichern Sie lange Aufträge häufig per Checkpoint, damit Sie fortsetzen können. Um Unterbrechungen ganz zu vermeiden, nutzen Sie den Filter „Interruptible: Off" für stabile Instanzen zu einem höheren Preis oder verlagern Sie den Auftrag auf RunPod Secure Cloud.
Bieten Cloud-GPU-Anbieter kostenloses Guthaben?
Ja. RunPod gibt ein Registrierungsguthaben von $10, Lambda Labs gibt $15, und Vast.ai gibt rund $5, wobei der Betrag bei Vast.ai je nach Aktion variiert. Dieses Guthaben reicht, um ein echtes Benchmark Ihres eigenen Modells bei jedem Anbieter auszuführen, sodass Sie die Gesamtkosten des Auftrags vergleichen können, bevor Sie echtes Geld einsetzen.
Ist die Nutzung von Cloud-GPU-Anbietern DSGVO-konform?
Sie kann es sein, hängt aber vom Anbieter und der Konfiguration ab. Wenn Sie personenbezogene Daten über Ihre LLM-Arbeitslast verarbeiten, gilt der Anbieter als Auftragsverarbeiter, und Sie benötigen einen Auftragsverarbeitungsvertrag (AV-Vertrag) nach Art. 28 DSGVO. RunPod kann einen AV-Vertrag abschließen und betreibt EU-Rechenzentren in den Niederlanden und Rumänien, sodass personenbezogene Daten innerhalb der EU bleiben können. Lambda Labs ist ausschließlich in den USA und kann keine EU-Datenresidenz bieten — eine Übermittlung in die USA erfordert zusätzliche Garantien und ist für sensible personenbezogene Daten oft nicht ratsam. Beim Vast.ai-Marktplatz variiert der Hoststandort, und es gibt keinen zentralen AV-Vertrag, weshalb er für personenbezogene Daten nicht zuverlässig konform ist. Praktischer Hinweis: Verarbeiten Sie personenbezogene Daten nur über RunPod-EU-Regionen mit unterzeichnetem AV-Vertrag, oder anonymisieren Sie die Daten, bevor sie die GPU-Instanz erreichen.
Eignet sich Cloud-GPU-Miete für den deutschen Mittelstand?
Ja, für die meisten mittelständischen Anwendungsfälle ist sie sogar gut geeignet. Der Mittelstand benötigt KI-Rechenleistung oft stoßweise — wöchentliche Fine-Tuning-Läufe, gelegentliche Batch-Inferenz — und genau dort ist Miete rund 30-50 % günstiger als eine Hardwareausgabe von $2,000-10,000, die anschließend gewartet werden muss. Für ein mittelständisches Unternehmen empfiehlt sich RunPod Secure Cloud als Standardwahl: vorhersehbare Preise, eine Verfügbarkeitsgarantie von 99 % und EU-Rechenzentren, die zu den DSGVO-Anforderungen passen. Achten Sie auf zwei Punkte aus Sicht der IT-Sicherheit: Schließen Sie einen AV-Vertrag ab, bevor personenbezogene Daten verarbeitet werden, und richten Sie Ihr internes Vorgehen an etablierten Standards wie dem BSI-Grundschutz aus (Zugriffskontrolle, Verschlüsselung, Protokollierung). Für stetige 24/7-Inferenz oder strikte Anforderungen, dass Daten die eigene Hardware nicht verlassen, kann eigene Hardware oder ein hybrider Ansatz sinnvoller sein.