Wichtigste Erkenntnisse
- Unified Memory ist die bindende Beschränkung. Auf Apple Silicon teilt sich das Modell einen einzigen Speicherpool mit dem System — ein Modell, das nicht in den Unified Memory passt, lässt sich nicht ausführen. Wählen Sie den Mac, dessen Speicher zu Ihrem Zielmodell passt, und optimieren Sie erst danach auf Bandbreite und Bauform.
- Der Speicher lässt sich nach dem Kauf nicht aufrüsten. Der Unified Memory von Apple Silicon ist verlötet. Was Sie kaufen, ist endgültig — dimensionieren Sie für das Modell, das Sie in zwei Jahren ausführen wollen, nicht nur für heute.
- Preis-Leistungs- / Server-Empfehlung: Mac Mini M5 Pro 64 GB (ca. 1.699 €) — lautlos, 25-55 W unter Last, rund 26-39 € Strom pro Jahr, und 64 GB führen 34B-Modelle aus. Der günstigste ernsthafte Einstieg in lokale KI auf Apple Silicon.
- Portable Empfehlung: MacBook Pro 16" M5 Max 64 GB (ca. 4.179 €) — die einzige ausgelieferte M5-Max-Maschine, 460 GB/s Bandbreite, führt 70B Q4 mit 7-11 Tok/s aus. Akzeptiert für die Portabilität eine thermische Drosselung von 10-15 % unter Dauerlast.
- Desktop-70B-Empfehlung: Mac Studio mit 128 GB — 614 GB/s Bandbreite führen 70B bei Q5 aus. Der M5-Mac-Studio ist noch nicht erschienen (erwartet Ende 2026); der Mac Studio M4 Max ist heute als verfügbare Alternative lieferbar.
- Die Bandbreite, nicht der Chipname, bestimmt das Tempo. Der M5 Max mit 460-614 GB/s erzeugt beim selben Modell rund doppelt so viele Tokens pro Sekunde wie der M5 Pro mit 307 GB/s.
- Apple Silicon tauscht reine Geschwindigkeit gegen Kapazität und Ruhe. Eine Desktop-RTX-GPU ist bei 7B-13B-Modellen schneller, aber ihre 24-32 GB VRAM fassen kein 70B-Modell, das ein Mac mit 128 GB problemlos ausführt.
- Der Stromverbrauch ist über die ganze Reihe niedrig. Ein Mac Mini zieht unter LLM-Last 25-55 W und ein M5 Max 60-100 W — gegenüber 300-450 W für eine Desktop-RTX-Karte bei vergleichbarer Arbeit.
Kurzfakten
- Server-Klasse (ca. 1.399-1.949 €): Mac Mini M5 Pro 64 GB — lautlos, Always-on, führt Modelle bis 34B aus.
- Portable Klasse (ca. 4.179-5.299 €): MacBook Pro 16" M5 Max 64-128 GB — führt 70B-Modelle unterwegs aus.
- Desktop-Klasse (ca. 2.499 €+): Mac Studio mit 128 GB — führt 70B bei Q5 aus; M5-Version noch nicht erschienen, M4 Max jetzt lieferbar.
- Faustregel für Unified Memory bei Q4_K_M: rund 0,6 GB pro Milliarde Parameter, plus 2-4 GB für Kontext und Tooling.
- Speicherbandbreite: M5 Pro 307 GB/s, M5 Max 460 GB/s (64 GB) bis 614 GB/s (128 GB) — die Geschwindigkeit skaliert mit der Bandbreite.
- Spanne des Stromverbrauchs: Mac Mini M5 Pro 25-55 W, MacBook Pro M5 Max 60-100 W unter LLM-Last.
- Preisrealität 2026: Apple hat die Preise für konfigurierten Speicher wegen einer Speicherknappheit angehoben — prüfen Sie vor dem Kauf den aktuellen Apple-Store-Preis.
Empfehlung der Redaktion: Mac Mini M5 Pro 64 GB
Für die meisten Käuferinnen und Käufer, die gezielt einen Mac für lokale KI wählen, ist der Mac Mini M5 Pro mit 64 GB Unified Memory die Wahl, die Leistungsfähigkeit, Preis und Betriebskosten ausbalanciert. Seine 64 GB fassen jedes Modell bis 34B mit Kontext-Reserve, er arbeitet lautlos und zieht unter Inferenzlast nur 25-55 W, und bei rund 1.699 € ist er der günstigste ernsthafte Einstieg in lokale KI auf Apple Silicon. Er gibt zudem einen idealen Always-on-KI-Server für Zuhause oder das Büro ab. Wechseln Sie nur dann zum MacBook Pro 16" M5 Max, wenn Sie Portabilität oder 70B-Modelle brauchen; wechseln Sie nur dann zu einem Mac Studio mit 128 GB, wenn Sie 70B in höherer Qualität auf dem Desktop brauchen. Der M5-Mac-Studio ist noch nicht erschienen — wer heute einen 70B-Desktop möchte, muss den Mac Studio M4 Max wählen oder warten.
📌Note: Diese Redaktionsempfehlung berücksichtigt ausschließlich das Preis-Leistungs-Verhältnis. PromptQuorum nimmt an keinem Affiliate-Programm teil, und die untenstehenden Links tragen keine Affiliate-Kennungen — es sind schlichte Referenzlinks, die keine Provision einbringen.
Wie die drei Macs für lokale KI 2026 abschneiden
Die Angaben zu Speicher und Bandbreite sind Apple-Spezifikationen. Die Inferenzgeschwindigkeiten sind gemessene 8B- und 70B-Q4-Werte aus PromptQuorum-Tests auf Apple Silicon mit dem M5 Pro und dem M5 Max; die Werte für den Mac Studio M5 sind Prognosen, da dieses Modell noch nicht erschienen ist. Die Preise sind eine Momentaufnahme vom Mai 2026 (Apple-Store Deutschland) — Apple hat 2026 die Preise für konfigurierten Speicher angehoben, prüfen Sie also vor dem Kauf den aktuellen Apple-Store-Preis.
📍 In einem Satz
Bei einem Mac für lokale LLMs entscheidet der Unified Memory, welche Modelle Sie laden können, und die Speicherbandbreite, wie schnell sie antworten — kaufen Sie nach dem Ersten und optimieren Sie das Zweite.
💬 In einfachen Worten
Stellen Sie sich den Unified Memory als einen gemeinsamen Tisch vor, den Modell, App und System zusammen nutzen. Ein Chip mit höherer Bandbreite räumt den Tisch schneller ab, aber wenn das Modell gar nicht auf den Tisch passt, spielt die Geschwindigkeit keine Rolle. Wählen Sie zuerst den Mac, dessen Tisch groß genug ist.
| Mac | Unified Memory | Bandbreite | Tempo (8B Q4) | Tempo (70B Q4) | Preis (Mai 2026) | Am besten für |
|---|---|---|---|---|---|---|
| Mac Mini M5 Pro 64 GB | 64 GB | 307 GB/s | 50-60 Tok/s | 8-12 Tok/s | ca. 1.699 € | Lautloser Always-on-Server, 34B-Modelle |
| MacBook Pro 16" M5 Max 64 GB | 64 GB | 460 GB/s | ca. 100-110 Tok/s | 7-11 Tok/s | ca. 4.179 € | Portable 70B-Workstation |
| MacBook Pro 16" M5 Max 128 GB | 128 GB | 614 GB/s | ca. 110-120 Tok/s | 12-16 Tok/s | ca. 5.299 € | Portable 70B Q5, mehrere Modelle |
| Mac Studio M4 Max 128 GB | 128 GB | ca. 410-546 GB/s | Schätzung auf Familienebene | Schätzung auf Familienebene | ca. 2.499 €+ (konfiguriert) | Desktop-70B, heute verfügbar |
| Mac Studio M5 Max 128 GB (unreleased) | 128 GB (prognostiziert) | 614 GB/s (prognostiziert) | noch nicht messbar | noch nicht messbar | nicht angekündigt | Erwartet Ende 2026 — noch nicht im Handel |
Welchen Mac sollten Sie kaufen?
Ihr größtes Zielmodell und Ihre Bauform entscheiden über den Mac; Ihr Budget entscheidet über die Speicherklasse innerhalb davon. Suchen Sie die Zeile, die zu Ihrer Situation passt.
| Ihre Situation | Kaufen Sie dies |
|---|---|
| Ich möchte einen lautlosen Always-on-KI-Server für Zuhause oder das Büro | Mac Mini M5 Pro 64 GB |
| Ich nutze 8B-13B-Modelle und möchte den günstigsten leistungsfähigen Mac | Mac Mini M5 Pro (32-64 GB) |
| Ich nutze 34B-Modelle am Schreibtisch und lege Wert auf niedrige Betriebskosten | Mac Mini M5 Pro 64 GB |
| Ich muss 70B-Modelle ausführen und das Gerät mit mir tragen | MacBook Pro 16" M5 Max 64 GB |
| Ich möchte 70B in Q5-Qualität und mehrere Modelle gleichzeitig betreiben | MacBook Pro 16" M5 Max 128 GB |
| Ich möchte einen 70B-Desktop-Rechner und heute kaufen | Mac Studio M4 Max 128 GB |
| Ich möchte gezielt den M5-Mac-Studio | Warten — erwartet Ende 2026, noch nicht erschienen |
| Ich bin unsicher und möchte den sichersten ersten Mac für lokale KI | Mac Mini M5 Pro 64 GB — später aufrüsten, falls er Ihnen zu klein wird |
Mac Mini M5 Pro: Der lautlose Always-on-Server
Der Mac Mini M5 Pro ist die Preis-Leistungs-Empfehlung und der beste Mac für einen Always-on-Server für lokale KI — lautlos, stromsparend und fähig, Modelle bis 34B auszuführen. Für die meisten Erstanwenderinnen und Erstanwender von Apple-Silicon-KI ist die 64-GB-Konfiguration die gesamte Leistungsfähigkeit, die sie benötigen, und ihr Verbrauch von 25-55 W macht den 24/7-Betrieb günstig.
- Mac Mini M5 (Basis, ca. 899 €, 16 GB): führt 7B-Modelle nur bei Q4 aus. Ausreichend für leichten Einzelnutzer-Chat, aber 16 GB sind für eine ernsthafte KI-Maschine zu klein — für den KI-Einsatz überspringen.
- Mac Mini M5 (ca. 1.199 €, 32 GB): bewältigt Modelle bis 13B bei Q4. Ein vertretbarer Einstieg, wenn Sie nur kleine Modelle ausführen, doch 32 GB sind schnell zu klein.
- Mac Mini M5 Pro 64 GB (ca. 1.699 €): die empfohlene Wahl. 307 GB/s Bandbreite, führt 8B-Modelle mit 50-60 Tok/s und 34B-Modelle mit 15-25 Tok/s aus. Genug Speicher, um ein LLM, Whisper-Spracherkennung und eine RAG-Pipeline gleichzeitig zu betreiben.
- Warum diesen Mac kaufen: günstigster Einstieg in Apple-Silicon-KI, lautloser Betrieb, 25-55 W Stromverbrauch (ca. 26-39 € Strom pro Jahr) und eine Stellfläche von rund 12,7 x 12,7 cm, die als Server in einen Schrank passt.
- Warum diesen Mac überspringen: Er fasst kein 70B-Modell und ist nicht portabel. Wenn 70B Ihr Ziel ist, wählen Sie stattdessen ein MacBook Pro M5 Max oder einen Mac Studio mit 128 GB.
💡Tip: Kaufen Sie den M5 Pro mit 64 GB, nicht den M5 mit 32 GB. Der zusätzliche Speicher ist der Unterschied zwischen einer Obergrenze bei 13B-Modellen und dem komfortablen Betrieb von 34B-Modellen — und der Speicher von Apple Silicon lässt sich später nicht ergänzen.
📌Note: Der Mac Mini M5 Pro gibt einen ausgezeichneten Headless-KI-Server ab: Ollama installieren, die API im LAN bereitstellen, und jedes Gerät im Haus kann ihn nutzen. Ihn ein Jahr lang im 24/7-Betrieb laufen zu lassen kostet weniger als einen Monat eines Cloud-Chat-Abos.
MacBook Pro 16" M5 Max: Die portable 70B-Workstation
Das MacBook Pro 16" M5 Max ist der einzige ausgelieferte Mac, der 70B-Modelle ausführt, und er tut dies in einer portablen Bauform. Es ist die Wahl für Käuferinnen und Käufer, die Modelle der 70B-Klasse brauchen und das Gerät mit sich tragen wollen. Der Kompromiss ist eine thermische Drosselung von 10-15 % unter Dauerinferenz und ein höherer Preis als bei einem Desktop mit demselben Chip.
- MacBook Pro 16" M5 Max 64 GB (ca. 4.179 €): 32-Core-GPU, 460 GB/s Bandbreite. Führt 8B-Modelle mit rund 100-110 Tok/s und Llama 3.1 70B Q4 mit 7-11 Tok/s aus. Der portable Einstieg in lokale 70B-KI.
- MacBook Pro 16" M5 Max 128 GB (ca. 5.299 €): 40-Core-GPU, 614 GB/s Bandbreite. Führt 70B bei Q5 (höhere Qualität) aus und unterstützt den Betrieb von zwei Modellen gleichzeitig — etwa ein 70B-Modell plus ein 13B-Modell.
- Warum diesen Mac kaufen: Sie brauchen 70B-Modelle und Portabilität, Sie möchten eine einzige Maschine für Kreativarbeit und KI, oder Sie präsentieren und reisen und können keinen Desktop zurücklassen.
- Warum diesen Mac überspringen: Wenn die Maschine den Schreibtisch nie verlässt, kostet ein Mac Studio mit demselben Speicher weniger und läuft kühler; wenn 34B-Modelle genügen, spart der Mac Mini M5 Pro über 2.000 €.
⚠️Warning: Das MacBook Pro 16" M5 Max drosselt unter Dauerinferenz um rund 10-15 %, sobald sich das Gehäuse erwärmt — typischerweise nach einigen Stunden Dauerlast. Für 24/7-Inferenz ist ein Mac Studio das bessere Werkzeug; für portable Schübe an 70B-Arbeit ist das MacBook Pro in Ordnung.
📌Note: Das MacBook Pro M5 Max mit 64 GB und mit 128 GB teilen dieselbe Chip-Familie. Die 128-GB-Version kauft Kapazität — 70B bei Q5 und parallele Modelle — sowie höhere Bandbreite, keine andere Geräteklasse.
Mac Studio: Die Desktop-Option für 70B
Der Mac Studio ist die Desktop-Empfehlung für den Betrieb von 70B-Modellen — doch der M5-Mac-Studio ist noch nicht erschienen, sodass Käuferinnen und Käufer heute die M4-Max-Version wählen oder warten. Ein Mac Studio mit 128 GB führt 70B in Q5-Qualität aus und bleibt unter Dauerlast leiser als ein MacBook Pro, weil das Desktop-Gehäuse keine Laptop-Wärmegrenze hat.
- Mac Studio M4 Max 128 GB (ca. 2.499 €+ konfiguriert, heute verfügbar): die aktuell ausgelieferte Option. Er führt 70B-Modelle aus und ist der richtige Kauf, wenn Sie jetzt einen 70B-Desktop möchten und nicht auf die M5-Auffrischung warten wollen.
- Mac Studio M5 Max (NOCH NICHT ERSCHIENEN — erwartet Ende 2026): Apple hat den M5-Mac-Studio nicht angekündigt. Jede Spezifikation oder jeder Preis zum M5-Mac-Studio ist eine Prognose. Eine vernünftige Erwartung, gestützt auf den M5-Max-Chip im MacBook Pro, sind 128 GB Unified Memory bei rund 614 GB/s Bandbreite — doch das ist nicht bestätigt, und es gibt keinen Preis.
- Warum einen Mac Studio kaufen: Sie möchten einen 70B-Desktop-Rechner, Sie möchten einen leiseren Dauerbetrieb als bei einem MacBook Pro, oder Sie möchten einen gemeinsam genutzten Desktop-KI-Server ohne Laptop-Akku- oder Wärmegrenzen.
- Warum einen Mac Studio überspringen: Wenn Sie Portabilität brauchen, kaufen Sie das MacBook Pro M5 Max; wenn 34B-Modelle genügen, ist der Mac Mini M5 Pro weit günstiger; wenn Sie gezielt den M5-Mac-Studio möchten, müssen Sie bis zu seinem Erscheinen warten.
⚠️Warning: Der Mac Studio M5 ist Stand Mai 2026 nicht im Handel. Zahlen Sie keinen Aufpreis in Erwartung von M5-Spezifikationen — wenn Sie heute einen 70B-Desktop brauchen, ist der Mac Studio M4 Max jetzt lieferbar und nachweislich in der Lage, 70B-Modelle auszuführen.
Wie viel Unified Memory brauchen Sie?
Bei Q4_K_M-Quantisierung braucht ein Modell rund 0,6 GB Unified Memory pro Milliarde Parameter, plus 2-4 GB für Kontext und Tooling — und auf einem Mac teilt sich dieser Speicher zusätzlich mit macOS selbst. Lassen Sie dem Betriebssystem Reserve: Ein Mac mit 16 GB ist kein Modellbudget von 16 GB.
- 8B-Modelle — 8-9 GB: passen in jeden Mac mit 16 GB oder mehr. Ein Mac mit 32 GB lässt komfortable Reserve.
- 13-14B-Modelle — 11-13 GB: brauchen 32 GB, sobald macOS und der Kontext-Overhead mitgezählt werden. Mac Mini mit 32 GB und mehr.
- 34B-Modelle — 21-25 GB: brauchen in der Praxis 64 GB. Der Mac Mini M5 Pro 64 GB ist hier die Preis-Leistungs-Empfehlung.
- 70B-Modelle bei Q4 — 39-42 GB: brauchen mindestens 64 GB, wobei 64 GB knapp werden, sobald Kontext hinzukommt. Das MacBook Pro M5 Max 64 GB ist die Untergrenze.
- 70B-Modelle bei Q5 oder parallele Modelle — 50-70 GB+: brauchen 128 GB. MacBook Pro M5 Max 128 GB oder ein Mac Studio mit 128 GB.
💡Tip: Der Speicher von Apple Silicon ist verlötet und lässt sich nicht aufrüsten. Kaufen Sie eine Klasse über Ihrem aktuellen Bedarf: Wenn Sie heute 34B-Modelle ausführen, sind 64 GB die Untergrenze, nicht die komfortable Wahl. Die vollständige Methode finden Sie im Unified-Memory-Leitfaden unter Weiterführende Artikel.
Entscheidungsdiagramm: Wählen Sie Ihren Mac in vier Fragen
Vier Fragen, in dieser Reihenfolge, leiten die meisten Käuferinnen und Käufer zu einem Mac.
📍 In einem Satz
Wählen Sie einen Mac für lokale KI, indem Sie zuerst die größte Modellgröße, zweitens die Portabilität, drittens den Always-on-Server-Einsatz und zuletzt die Verfügbarkeit beantworten.
💬 In einfachen Worten
Beginnen Sie mit dem größten Modell, das Sie tatsächlich ausführen wollen, und lassen Sie dies den benötigten Speicher festlegen. Entscheiden Sie dann, ob es reisen muss, ob es rund um die Uhr läuft und ob Sie auf den M5-Mac-Studio warten können. In dieser Reihenfolge vorzugehen ist der Weg, mit dem man vermeidet, einen Mac zu kaufen, in den das eigene Modell nicht passt.
- 1. Was ist das größte Modell, das Sie ausführen möchten? 8-13B: Mac Mini 32-64 GB. 34B: Mac Mini M5 Pro 64 GB. 70B Q4: MacBook Pro M5 Max 64 GB. 70B Q5 oder parallel: MacBook Pro mit 128 GB oder Mac Studio.
- 2. Muss die Maschine sich bewegen? Ja: MacBook Pro 16" M5 Max. Nein: Mac Mini (bis 34B) oder Mac Studio (70B).
- 3. Ist es ein Always-on-Server? Ja: Mac Mini M5 Pro 64 GB — lautlos, 25-55 W, am günstigsten im 24/7-Betrieb. Nein: nach Modellgröße oben wählen.
- 4. Brauchen Sie die Maschine heute? Wenn Sie jetzt einen 70B-Desktop möchten, kaufen Sie den Mac Studio M4 Max — der M5-Mac-Studio ist noch nicht erschienen und erst Ende 2026 erwartet.
Wo kaufen
Apple verkauft jede Konfiguration direkt; Amazon und andere Händler führen gängige Konfigurationen, mitunter unter dem Apple-Listenpreis. Die untenstehenden Links sind schlichte Produktsuch-Links; sie tragen keine Affiliate-Kennungen und bringen keine Provision ein.
- Apple Store (apple.com): die einzige Quelle für jede Speicher- und Festplattenkonfiguration, einschließlich Build-to-Order. Erforderlich, wenn Sie eine nicht standardmäßige Konfiguration wünschen.
- Amazon: führt beliebte feste Konfigurationen von Mac Mini und MacBook Pro, mitunter unter dem Apple-Listenpreis rabattiert. Die Auswahl an Build-to-Order-Konfigurationen mit viel Speicher ist begrenzt.
- Apple Refurbished: Macs der Vorgenerationen (Mac Studio M4 Max, ältere MacBook Pros) mit Rabatt und voller Garantie — eine sinnvolle Option für einen 70B-Desktop heute.
- Fachhändler und autorisierte Wiederverkäufer: führen gängige Konfigurationen und unterbieten gelegentlich den Apple-Preis; nützlich für das MacBook Pro 16" M5 Max.
⚠️Warning: Apple hat 2026 die Preise für konfigurierten Speicher angehoben, ausgelöst durch dieselbe Speicherknappheit, die GPUs verteuert hat. Die Euro-Beträge hier sind eine Momentaufnahme vom Mai 2026 — öffnen Sie vor dem Kauf das aktuelle Apple-Store-Angebot und prüfen Sie, ob sich das benötigte Speicher-Upgrade verschoben hat.
Häufige Fehler beim Kauf eines Macs für lokale KI
- Nach dem Chipnamen statt nach Unified Memory kaufen. Ein schnellerer M5 Max mit zu wenig Speicher fasst Ihr Modell nicht. Bestätigen Sie zuerst, dass das Modell mit 2-4 GB Reserve in den Unified Memory passt, und vergleichen Sie erst dann die Bandbreite.
- Einen Mac mit 16 GB für KI-Arbeit kaufen. 16 GB enden bei 7B-Modellen und werden mit macOS geteilt. Für eine ernsthafte KI-Maschine sind 64 GB die praktische Untergrenze.
- Vergessen, dass sich der Speicher von Apple Silicon nicht aufrüsten lässt. Der Speicher ist verlötet. Wer zu klein kauft, dem bleibt als einzige Lösung ein neuer Mac — dimensionieren Sie eine Klasse über dem heutigen Bedarf.
- Annehmen, dass der M5-Mac-Studio verfügbar ist. Er ist Stand Mai 2026 nicht erschienen. Wenn ein Angebot M5-Mac-Studio-Spezifikationen verspricht, behandeln Sie es als Prognose — kaufen Sie den Mac Studio M4 Max oder warten Sie.
- Ein MacBook Pro für einen schreibtischgebundenen 24/7-Server kaufen. Es drosselt unter Dauerlast. Für einen Always-on-Server laufen der Mac Mini M5 Pro oder ein Mac Studio kühler und leiser.
- Für 8B-Modelle überdimensionieren. Wenn 8B-Modelle Ihren Anwendungsfall abdecken, ist ein Mac mit 128 GB verschwendetes Geld. Passen Sie die Speicherklasse an das Modell an, nicht an das gerade verfügbare Budget.
- Sich an Apples Preisen aus dem Vorjahr orientieren. Apple hat 2026 die Preise für konfigurierten Speicher angehoben — budgetieren Sie gegen den aktuellen Apple-Store-Preis, nicht gegen eine erinnerte Zahl.
Quellen
- Apple Mac Mini Technische Daten — Offizielle Angaben zu Unified Memory, Chip und Stromverbrauch der Mac-Mini-M5-Reihe.
- Apple MacBook Pro Technische Daten — Offizielle Angaben zu Unified Memory, GPU-Kernen und Speicherbandbreite des M5 Max.
- Apple Mac Studio — Aktuelle Mac-Studio-Palette und Konfigurationsoptionen (M4-Max-Generation Stand Mai 2026).
- M5 Pro vs. M5 Max LLM-Benchmarks 2026 — PromptQuorum-Hardwaretests: gemessene Tokens pro Sekunde für 8B- und 70B-Modelle auf dem M5 Pro und dem M5 Max.
- Mac Mini M5 als Server für lokale KI — PromptQuorum-Tests: Stromverbrauch, Stromkosten und Always-on-Server-Leistung des Mac Mini M5 Pro.
FAQ
Was ist der günstigste Mac, der lokale LLMs gut ausführt?
Der Mac Mini M5 Pro 64 GB für rund 1.699 € ist der günstigste Mac, der lokale LLMs gut ausführt. Seine 64 GB Unified Memory fassen jedes Modell bis 34B bei Q4-Quantisierung, er führt 8B-Modelle mit 50-60 Tokens pro Sekunde aus und zieht nur 25-55 W. Die Mac-Mini-Modelle mit 16 GB und 32 GB sind günstiger, werden aber schnell zu klein — 64 GB sind die praktische Untergrenze für ernsthaften KI-Einsatz.
Ist der Mac Studio M5 schon verfügbar?
Nein. Stand Mai 2026 ist der M5-Mac-Studio nicht erschienen, und Apple hat weder Spezifikationen noch Preise angekündigt. Alle Angaben zum M5-Mac-Studio, die Sie sehen, sind Prognosen. Wenn Sie heute einen 70B-Desktop-Mac brauchen, ist der Mac Studio M4 Max jetzt lieferbar und nachweislich in der Lage, 70B-Modelle auszuführen; andernfalls wird der M5-Mac-Studio später im Jahr 2026 erwartet.
Wie viel Unified Memory brauche ich für lokale LLMs auf einem Mac?
Bei Q4_K_M-Quantisierung planen Sie rund 0,6 GB pro Milliarde Parameter plus 2-4 GB Overhead ein und bedenken, dass macOS denselben Pool teilt. Das bedeutet etwa 8-9 GB für 8B-Modelle, 21-25 GB für 34B und 39-42 GB für 70B. Ein Mac mit 64 GB führt 34B komfortabel aus und fasst 70B Q4 gerade so; für 70B bei Q5 oder den Betrieb mehrerer Modelle sind 128 GB nötig.
Mac Mini oder MacBook Pro für lokale KI?
Wählen Sie den Mac Mini M5 Pro, wenn die Maschine am Schreibtisch bleibt und 34B-Modelle Ihre Obergrenze sind — er ist weit günstiger, lautlos und ideal als Always-on-Server. Wählen Sie das MacBook Pro 16" M5 Max, wenn Sie 70B-Modelle ausführen oder das Gerät tragen müssen. Das MacBook Pro ist der einzige ausgelieferte Mac, der 70B ausführt, aber es drosselt unter Dauerlast.
Kann ein Mac 70B-Modelle ausführen?
Ja. Ein MacBook Pro 16" M5 Max mit 64 GB führt Llama 3.1 70B Q4 mit 7-11 Tokens pro Sekunde aus, und die 128-GB-Version führt 70B bei Q5 mit 8-12 Tokens pro Sekunde aus. Ein Mac Studio mit 128 GB führt 70B ebenfalls komfortabel aus. Der Mac Mini M5 Pro kann das nicht — 64 GB sind für 70B zu knapp, sobald der macOS-Overhead mitgezählt wird.
Ist ein Mac schneller als eine NVIDIA-GPU für lokale LLMs?
Nein, nicht bei der reinen Geschwindigkeit für kleine Modelle — eine Desktop-RTX-Karte erzeugt bei 7B-13B-Modellen mehr Tokens pro Sekunde. Der Vorteil des Macs ist Kapazität und Effizienz: Ein Mac mit 128 GB fasst ein 70B-Modell, das eine RTX-Karte mit 24-32 GB nicht fasst, und tut dies lautlos bei 60-100 W gegenüber 300-450 W. Kaufen Sie einen Mac für Kapazität, Ruhe und niedrige Betriebskosten, nicht für reine Geschwindigkeit.
Kann ich den Speicher in einem Mac später aufrüsten?
Nein. Der Unified Memory von Apple Silicon ist mit dem Chip-Package verlötet und lässt sich nach dem Kauf nicht ändern. Welcher Speicher auch immer verbaut ist, er ist für die Lebensdauer der Maschine endgültig. Dimensionieren Sie für das größte Modell, das Sie in den nächsten zwei bis drei Jahren ausführen erwarten, nicht nur für heute.
Wie viel kostet der Betrieb eines Macs als KI-Server?
Sehr wenig. Ein Mac Mini M5 Pro zieht unter LLM-Last 25-55 W und im Leerlauf rund 8 W. Ihn ein volles Jahr im 24/7-Betrieb laufen zu lassen kostet bei deutschen Strompreisen rund 26-39 € — weniger als einen Monat eines typischen Cloud-KI-Abos. Diese niedrigen Betriebskosten sind ein Kerngrund, warum der Mac Mini die Preis-Leistungs-Empfehlung für einen Always-on-Server ist.
Erfüllt lokale KI auf einem Mac die Anforderungen der DSGVO an den Datenstandort?
Ja, in einer entscheidenden Hinsicht. Wenn ein LLM lokal auf einem Mac läuft, verlassen Prompts, Dokumente und Ausgaben das Gerät nicht — es findet keine Übermittlung an einen Cloud-Anbieter und keine Drittlandübermittlung statt. Damit entfällt die rechtliche Komplexität rund um Art. 44 ff. DSGVO und Standardvertragsklauseln, und personenbezogene Daten bleiben physisch im eigenen Verantwortungsbereich. Ein Mac Mini M5 Pro als Headless-Server hält die Verarbeitung vollständig im eigenen Netz, was die Erfüllung von Pflichten zur Datenresidenz und die Auftragsverarbeitungs-Dokumentation deutlich vereinfacht. Die übrigen DSGVO-Pflichten — Rechtsgrundlage, Löschkonzept, Betroffenenrechte — bleiben davon unberührt; lokale Inferenz löst den Aspekt der Datenübermittlung, nicht den gesamten Datenschutz.
Ist ein Mac eine sinnvolle Lokale-KI-Maschine für den deutschen Mittelstand?
Für viele mittelständische Unternehmen ja. Ein Mac Mini M5 Pro 64 GB für rund 1.699 € ist eine einmalige Investition, die einen Always-on-KI-Server für ein ganzes Team bereitstellt — installiert man Ollama und stellt die API im Firmennetz bereit, nutzen alle Arbeitsplätze 34B-Modelle ohne laufende Pro-Nutzer-Lizenzkosten. Bei rund 26-39 € Strom pro Jahr und lautlosem Betrieb passt das Gerät in jedes Büro und benötigt kein Rechenzentrum. Für den Mittelstand sind die ausschlaggebenden Vorteile die kalkulierbaren Gesamtkosten und die Tatsache, dass sensible Geschäfts- und Kundendaten das Haus nicht verlassen. Erst wenn 70B-Modelle oder hohe Parallellast gefragt sind, lohnt der Schritt zu einem Mac Studio mit 128 GB.