Skip to main content
PromptQuorumPromptQuorum
Startseite/Lokale LLMs/Ollama Update Juni 2026: v0.30.8 + Top 10 Open-Source-Modelle
Beste Modelle

Ollama Update Juni 2026: v0.30.8 + Top 10 Open-Source-Modelle

·9 Min. Lesezeit·Von Hans Kuepper · Gründer von PromptQuorum, Multi-Model-AI-Dispatch-Tool · PromptQuorum

Aktualisiert im Juni 2026. Die aktuelle Ollama-Version ist v0.30.8 (veröffentlicht am 12. Juni 2026), die die GGUF-Hardwareunterstützung über llama.cpp erweitert und die Apple-Silicon-MLX-Engine verbessert. Die neuesten Modelle in der Bibliothek diesen Monat sind MiniMax M3 (1. Juni, Open-Weight, 1M-Token-Kontext + native Vision), NVIDIA Nemotron 3 Ultra (4. Juni) und DeepSeek V4 Pro, die sich zu Kimi K2.6, Qwen 3.6, GLM-5.1, gpt-oss und Gemma 4 gesellen. Am häufigsten heruntergeladen bleibt insgesamt die Llama-Familie (Llama 4 Scout, Llama 3.x); das beste Modell für Consumer-Hardware ist Qwen 3.6 27B (77,2% SWE-bench).

Präsentation: Ollama Update Juni 2026: v0.30.8 + Top 10 Open-Source-Modelle

Die Präsentation behandelt: Top 10 Ollama-Modelle nach Download-Häufigkeit, Leistungsvergleich (60-74% HumanEval), beste Modelle nach Anwendungsfall (Chat, Codierung, Reasoning, Vision), DeepSeek-R1 Chain-of-Thought-Reasoning und exakte Pull-Befehle. Laden Sie die PDF als Ihre Ollama-Modellauswahl-Referenzkarte herunter.

Folien unten ansehen oder als PDF herunterladen. Präsentation herunterladen (PDF)

Wichtigste Erkenntnisse

  • Bestes Modell fuer Consumer-Hardware: Qwen 3.6 27B (77,2% SWE-bench, passt in 24 GB bei Q4). Ausgewogen: qwen3:30b.
  • Am meisten heruntergeladen: Llama 3.2 3B (Tutorials) und die Llama-Familie.
  • Bestes Reasoning: DeepSeek-R1 (Chain-of-Thought) und gpt-oss:20b (einstellbares Reasoning, ~o3-mini-Niveau).
  • Bestes Coding: Kimi K2.6 (Frontier MoE), Qwen 3.6 27B (beste dicht), Devstral Small 24B (beste agentic), qwen3-coder:30b (Vervollstaendigung).
  • Bestes kleines / 16 GB: gpt-oss:20b. Beste Vision/multimodal: Gemma 4 (E4B+). Bester Long-Context (10M) / grosse Multimodalitaet: Llama 4 Scout (~55 GB).
  • Ollama-Bibliothek Juni 2026: 4.500+ Modelle. Alle über `ollama pull <name>` verfügbar.

Was ist neu in Ollama — Juni 2026 Update

Aktuelle Ollama-Version: v0.30.8 (veröffentlicht am 12. Juni 2026). Dies ist die neueste stabile Version, verfügbar über ollama.com/download. Aktualisieren Sie mit `curl https://ollama.ai/install.sh | sh` (macOS: `brew upgrade ollama`), dann bestätigen Sie mit `ollama --version`.

Was sich in der v0.30-Reihe geändert hat (Mai–Juni 2026): Ollama v0.30 hat die GGUF-Modellkompatibilität über llama.cpp erweitert und die Hardwareunterstützung über Apple Silicon hinaus ausgedehnt, und die MLX-Engine wurde am 11. Juni 2026 für die bislang schnellste Apple-Silicon-Inferenz verbessert — höhere Ausgabequalität bei geringerem Speicherbedarf. Point-Releases bis v0.30.8 fügten Gemma 4 QAT-Gewichte (5. Juni), Hermes Desktop (7. Juni), verbesserte Prompt-/KV-Cache-Wiederverwendung und Windows-Konfigurationspfad-Korrekturen hinzu. Vollständige Notizen: github.com/ollama/ollama/releases.

Neueste Modelle, die diesen Monat hinzugefügt wurden (Juni 2026):

  • MiniMax M3 (MiniMax, 1. Juni 2026) — Neuestes Open-Weight-Flaggschiff: das erste Modell, das Frontier-Coding (SWE-Bench Pro 59.0), ein 1M-Token-Kontextfenster und native Bild-/Videoeingabe kombiniert. Wird in die Ollama-Bibliothek ausgerollt — Verfügbarkeit prüfen mit `ollama pull minimax-m3`.
  • NVIDIA Nemotron 3 Ultra (NVIDIA, 4. Juni 2026) — Entwickelt für durchsatzstarkes Reasoning und langlaufende Agenten-Workflows. NVIDIA Open Model License. Pull: `ollama pull nemotron3-ultra`
  • DeepSeek V4 Pro (DeepSeek, 23. April 2026) — Spezialist für algorithmisches Coding, 93.5% LiveCodeBench, MIT-Lizenz. Budget-Variante DeepSeek V4 Flash für leichtere Hardware. Pull: `ollama pull deepseek-v4-pro`
  • Kimi K2.6 (Moonshot AI, 20. April 2026) — Frontier-Coding-Modell, SWE-Bench Pro 58.6, SWE-bench Verified 80.2%. MoE-Architektur (32B aktiv / 1T gesamt). Modified MIT-Lizenz.
  • Qwen 3.6 27B (Alibaba, 16. April 2026) — Bestes Modell fuer Consumer-Hardware, 77,2% SWE-bench, Apache 2.0, passt in 24 GB bei Q4. Auch Qwen3.6-35B-A3B (MoE, 73,4 SWE-bench).
  • GLM-5.1 (Z.ai, 7. April 2026) — 744B / 40B aktiv MoE, MIT-Lizenz, SWE-Bench Pro 58.4. Führender Structured Code Generator.
  • gpt-oss (OpenAI, 2026) — Open-Weight MoE: gpt-oss:20b (21B gesamt / 3,6B aktiv, läuft in 16 GB, ~o3-mini-Niveau, einstellbares Reasoning) und gpt-oss:120b (80 GB).
  • Gemma 4 (Google, 2. April 2026) — Multimodale Größen E2B / E4B / E12B (26B MoE) / E27B (31B dicht), alle mit Vision und Tool Calling. QAT-Gewichte hinzugefügt am 5. Juni 2026. E4B läuft in ~6 GB VRAM.
bash
# Ollama auf die neueste Version aktualisieren (v0.30.8)
curl https://ollama.ai/install.sh | sh

# Oder auf Mac: brew upgrade ollama

# Aktuelle Version prüfen
ollama --version  # Ausgabe: ollama version 0.30.8

# Die neuesten Juni-2026-Modelle pullen
ollama pull minimax-m3
ollama pull deepseek-v4-pro
ollama pull kimi-k2.6

Top-Modelle nach Kategorie

Die Qualität der Modellausgabe hängt stark davon ab, wie Sie prompten. Für strukturierte Techniken, die mit allen lokalen Modellen funktionieren — darunter Chain-of-Thought, Few-Shot-Beispiele und Output-Formatierung — siehe den Prompt-Engineering-Guide. Für Reasoning-Aufgaben verbessert Chain-of-Thought-Prompting erheblich DeepSeek-R1 und Qwen3 Output-Qualität. Für Quantisierungskompromisse dieser Modelle siehe den Quantisierungsleitfaden →. Um zu ermitteln, wie viel VRAM jedes Modell benötigt, siehe den VRAM-Anforderungsleitfaden →. Für Agent-Workflows mit Gemma 4 siehe Tree-of-Thought und ReAct. Sobald ein Tool-Calling-Modell aus dieser Liste in einer mehrstufigen Schleife mit Datei- und Datenbankzugriff läuft, siehe Lokale KI-Agenten mit MCP für das Open-Source-Orchestrierungsmuster.

  • Allgemeines Chat (Anfänger): `ollama run llama3.2:3b` -- die meiste Dokumentation, am besten unterstütztes Einstiegsmodell.
  • Allgemeines Chat (beste Wahl): `ollama run qwen3.6:27b` -- 77,2% SWE-bench, bestes Modell fuer Consumer-Hardware, passt in 24 GB bei Q4. Ausgewogen: `ollama run qwen3:30b`. Für 8 GB Maschinen `ollama run llama3.2:3b` verwenden.
  • Long-Context / multimodal: `ollama run llama4:scout` -- 10M-Token-Kontext + multimodal, MoE (17B aktiv/109B gesamt). Benötigt ~55 GB VRAM bei Q4 (passt in 24 GB nur bei 1,78-Bit, ~20 tok/s).
  • Bestes kleines / 16 GB: `ollama run gpt-oss:20b` -- 21B gesamt / 3,6B aktiv MoE, ~o3-mini-Niveau, einstellbares Reasoning. Größer: `ollama run gpt-oss:120b` (80 GB).
  • Codierung (7B): `ollama run qwen3:8b` -- 76% HumanEval, verbessert gegenüber Qwen3, mehrsprachig.
  • Codierung (bestes Agentic, 24B): `ollama run devstral-small:24b` -- Bestes Agentic Coding-Modell (Multi-Datei-Edits, Debugging). 16 GB RAM. Von Mistral AI.
  • Codierung (bestes Dicht, 27B): `ollama run qwen3.6:27b` -- 77,2% SWE-bench. Bestes dichtes Coding-Modell. 22 GB VRAM.
  • Codierung (Frontier MoE): `ollama run kimi-k2.6` -- SWE-Bench Pro 58.6 (gleichauf mit GPT-5.5), Top-Tier. MoE (32B aktiv/1T gesamt). Modified MIT-Lizenz. Benötigt Quantisierung für Consumer-Hardware.
  • Agent-Aufgaben und Tool-Calling: `ollama run gemma4:e4b` -- Veröffentlicht 2. April 2026. Built-in Tool-Calling + Vision-Unterstützung. Empfohlen für lokale Agenten, Function-Calling und strukturierte Ausgabe. 6 GB RAM.
  • Reasoning und Mathematik: `ollama run deepseek-r1:7b` -- Chain-of-Thought-Modell, beste lokale Mathe-Leistung bei 7B.
  • Mehrsprachig: `ollama run qwen3:7b` -- 29+ native Sprachen, stärkste nicht-englische Unterstützung, 76% HumanEval.
  • Bildverarbeitung: `ollama run gemma4:e4b` -- Vision + Tool Calling (Juni 2026). Oder `ollama run llama3.2-vision:11b` für dedizierte Vision.
  • Schnell und leichtgewichtig: `ollama run gemma2:2b` -- schnellste CPU-Inferenz, 1,7 GB RAM.
  • Hohe Qualität (16 GB RAM): `ollama run mistral-small3.1` -- nahe 70B Qualität bei 14 GB RAM.
  • Heimautomatisierung / Wake-Word-KI: `ollama run phi4-mini` — Phi-4 Mini (3.8B, ~3 GB VRAM) verarbeitet Home Assistant Sprachbefehle mit 20–25 Tok/Sek auf einem Mini-PC ohne dedizierte GPU. Siehe Home Assistant + Ollama Integrationsguide →.
Ollama-Modellauswahl nach Anwendungsfall: Juni 2026. Chat: llama4:scout, Codierung: qwen3.6:27b, Reasoning: deepseek-r1:7b.
Ollama-Modellauswahl nach Anwendungsfall: Juni 2026. Chat: llama4:scout, Codierung: qwen3.6:27b, Reasoning: deepseek-r1:7b.

DeepSeek-R1: Reasoning-Durchbruch

DeepSeek-R1 wurde im Januar 2025 veröffentlicht und verkörpert einen signifikanten Fortschritt im Reasoning auf lokalen Größen. Das Modell führt explizite Chain-of-Thought (CoT) Reasoning durch: Sie sehen die internen Gedankenketten des Modells, bevor die endgültige Antwort gegeben wird.

  • Größen verfügbar: 1,5B (mobil), 7B, 70B. 1,5B ist für Bildungsgeräte ausreichend; 7B übertrifft Llama 3.3 13B bei Mathematik.
  • Leistung auf Benchmarks: 52 % bei MATH (gegenüber 23 % Llama 3.3 8B), verbesserte Logik und mehrschrittige Problemlösung.
  • RAM-Anforderungen: 1,5B: 2 GB, 7B: 6 GB, 70B: 44 GB (Q4-Quantisierung).
  • Lizenz: Deepseek-Lizenzen (einige Einschränkungen bei Decompilation; überprüfen Sie vor Enterprise-Einsatz).
  • EU-Datenhandhabung: Bei Einsatz in EU-Regionen verarbeitet DeepSeek-R1 Daten gemäß EU-Datenschutzbestimmungen. Lokale Ausführung auf privaten Servern oder Geräten gewährleistet Datensouveränität -- keine Cloud-Übertragung erforderlich.
bash
ollama run deepseek-r1:7b
# Beispielprompt: "Wenn zwei Züge sich einer Station mit 100 km/h nähern, wann treffen sie sich?"
# DeepSeek-R1:7b antwortet mit sichtbaren Gedankenketten:
# <Gedanken>
# ...Pfade erkunden, Annahmen überprüfen...
# </Gedanken>
# Antwort: Sie treffen sich ...
DeepSeek-R1 7B vs Mistral Small: 52% vs 28% MATH. Chain-of-Thought-Reasoning -- langsamer, deutlich genauer.
DeepSeek-R1 7B vs Mistral Small: 52% vs 28% MATH. Chain-of-Thought-Reasoning -- langsamer, deutlich genauer.

Vision-Modelle auf Ollama

Juni 2026: Diese Modelle auf Ollama unterstützen Bildeingabe (multimodal). Gemma 4 unterstützt sowohl Vision ALS AUCH Tool Calling – einzigartig unter Vision-Modellen auf Ollama.

ModellRAMBildunterstützungOllama Befehl
llama3.2-vision:11b~8 GBJaollama run llama3.2-vision:11b
llama3.2-vision:90b~55 GBJaollama run llama3.2-vision:90b
gemma3:9b (vision)~6 GBJaollama run gemma3:9b
minicpm-v:8b~5,5 GBJaollama run minicpm-v
gemma4:e4b~6 GBJa ✓ollama run gemma4:e4b
5 Ollama-Vision-Modelle für Bildeingabe. Gemma 4 E4B (6 GB) mit Tool Calling. Llama 3.2 Vision 11B (8 GB) für dedizierte Vision. Alle lokal.
5 Ollama-Vision-Modelle für Bildeingabe. Gemma 4 E4B (6 GB) mit Tool Calling. Llama 3.2 Vision 11B (8 GB) für dedizierte Vision. Alle lokal.

Vollständiger Top-10-Vergleich

Download-Zählungen bevorzugen immer noch Llama 3.x aufgrund der Häufigkeit von Tutorials. Für neue Projekte im Juni 2026 sind Qwen 3.6 27B (bestes Modell fuer Consumer-Hardware), Kimi K2.6, gpt-oss:20b und qwen3:30b zu bevorzugen.

#ModellBeste fürRAMHumanEval
1Qwen 3.6 27BBestes Modell fuer Consumer-Hardware24 GB (Q4)77,2% SWE-bench
2Kimi K2.6Frontier-Coding, MoE (32B/1T), Modified MITQuantisiert58,6 SWE-Bench Pro
3gpt-oss:20bBestes kleines / 16 GB, einstellbares Reasoning16 GB~o3-mini
4qwen3:30bAusgewogen; qwen3-coder:30b für Code~18 GBstark
5Devstral Small 24BAgentic Codierung (Multi-Datei)16 GB80%
6deepseek-r1:7bReasoning, Mathe5 GB
7gemma4:e4bVision + Tool Calling (multimodal)~6 GB
8Llama 4 ScoutLong-Context 10M + multimodal, MoE~55 GB (Q4)85%
9mistral-small3.1Qualität bei 16 GB14 GB74%
10Llama 3.2 3BEinstiegsmodell, allgemeiner Chat2,5 GB60%
Beste Ollama-Modelle Juni 2026: Qwen 3.6 27B (bestes Modell, 24 GB Q4), Kimi K2.6, gpt-oss:20b. Llama 4 Scout für 10M-Token-Kontext (~55 GB).
Beste Ollama-Modelle Juni 2026: Qwen 3.6 27B (bestes Modell, 24 GB Q4), Kimi K2.6, gpt-oss:20b. Llama 4 Scout für 10M-Token-Kontext (~55 GB).

Wie durchsuchen Sie die Ollama-Bibliothek?

Es gibt zwei Möglichkeiten, mit Ollama-Modellen zu arbeiten. Installierte Modelle wechseln: In der Ollama Mac-App klicken Sie auf den Modell-Dropdown-Button am unteren Rand des Chat-Eingabefeldes (zeigt den aktuellen Modellnamen, z. B. "llama4:scout"), um zwischen lokal installierten Modellen zu wechseln. Neue Modelle finden und herunterladen: Besuchen Sie ollama.com/library, um 4.500+ Modelle nach Kategorie zu durchsuchen, und nutzen Sie dann die CLI-Befehle unten zum Herunterladen.

  • Öffnen Sie https://ollama.ai/library in einem Webbrowser für die vollständige durchsuchbare Bibliothek aller 4.500+ Modelle.
  • Filteroptionen: Modellgröße, Lizenz, Veröffentlichungsdatum, Benchmarks (MMLU, HumanEval, MATH).
  • Ratings pro Modell: Nutzer-Downloads, GitHub-Sterne (für das Basis-Modell), Ollama-Sterne.
  • Neue Modelle: Ollamás Bibliothek wird kontinuierlich aktualisiert (neue Modelle erscheinen Tage nach der Veröffentlichung).
bash
ollama list
# Zeigt alle installierten Modelle an

ollama pull llama4:scout
# Lädt Llama 4 Scout herunter (beste Qualität, MoE)

ollama pull qwen3.6:27b
# Lädt Qwen 3.6 27B herunter (Best Coding Model, 77,2% SWE-bench)

ollama run llama4:scout
# Startet eine interaktive Chat-Sitzung

ollama run -m deepseek-r1:7b "Lösen Sie 2^10"
# Löst Reasoning-Aufgaben mit CoT aus

Häufige Fehler bei der Auswahl von Ollama-Modellen

Ich habe einen großen Modell-Tag gepullt, aber mein RAM ist voll. Was ist passiert?

Zu schnell gepullt, ohne den RAM zu überprüfen. Verwenden Sie `ollama show [model-name]` BEVOR Sie pullen. Beispiel: `ollama show llama3.1:70b` zeigt RAM-Anforderungen an (~42-48 GB mit Q4-Quantisierung). Für Anfänger: Bleiben Sie bei 7B-13B-Modellen (unter 16 GB RAM). Löschen Sie mit `ollama rm [model-name]`.

Ich verwende ein Allzweck-Modell wie Llama 3.3, aber die Codierung ist langsam. Warum?

Llama 3.3 8B ist Allzweck-freundlich, aber Qwen3 oder Mistral Small sind für technische Aufgaben spezialisiert. Für Codierung: Schalten Sie zu Qwen3 7B um (75,4 % HumanEval gegenüber 68,2 % für Llama). Beide laufen unter 8 GB RAM.

Ich habe ein Modell gepullt, sehe es aber nicht in der Liste. Wie überprüfe ich die Installation?

Führen Sie `ollama list` aus. Ollama speichert Modelle unter `~/.ollama/models/` (Mac) oder `%USERPROFILE%.ollamamodels` (Windows). Wenn sich das Modell dort befindet, aber nicht in der Liste angezeigt wird, neustarten Sie den Ollama-Daemon: Beenden Sie Ollama und öffnen Sie es erneut.

Nächste Schritte

Häufig gestellte Fragen

Wie viel RAM brauche ich für ein lokales Modell?

7B-Modelle benötigen 6,5-8 GB RAM. 13B-Modelle: 11-14 GB. 70B-Modelle: 42-48 GB mit Quantisierung (Q4_K_M). Kleiner (3B): 2-3 GB. Überprüfen Sie mit `ollama show [model-name]` vor dem Herunterladen.

Kann ich Ollama-Modelle offline ausführen?

Ja. Nach dem initialen Download läuft jede Inferenz lokal, ohne Internetverbindung. Ollama überprüft gelegentlich Updates (aber nicht automatisch angewendet).

Welches Modell hat die beste deutsche Sprachunterstützung?

Qwen3 / Qwen 3.6 27B hat überlegene deutsche Unterstützung (trainiert auf CulturaX und DE-Wikitext). Llama 3.3 ist für Deutsch angemessen, aber Qwen ist präziser. Devstral Small 24B (Mistral AI, französisches Unternehmen, Apache 2.0) ist für Deutsch und Französisch kompetent.

Sind Ollama-Modelle wirklich kostenlos?

Ja. Alle auf Ollama verfügbaren Modelle sind Open-Source mit freien Lizenzen (Apache 2.0, Meta Llama 3 Community, Deepseek). Keine Abonnements, keine API-Gebühren. Laden Sie herunter, installieren Sie lokal, und verwenden Sie unbegrenzt.

Wie schnell ist DeepSeek-R1 wirklich?

Erzeugungsgeschwindigkeit: 15-25 Token/Sek. auf M1 Pro (ähnlich wie Llama 3.3 7B). Die Gesamtlatenz ist höher, weil Gedankenketten ausgegeben werden -- erwarten Sie 8-12 Sekunden für mittlere Anfragen. Für Echtzeit-Interaktion nutzen Sie Llama 3.3 oder Mistral.

Warum sollte ich Ollama verwenden und nicht einfach ChatGPT Plus?

Datenschutz: Keine Chats an OpenAI übertragen. Kosten: Kein monatliches Abonnement; eine GPU-Einmalinvestition. Offline: Funktioniert vollständig ohne Internet. Anpassbar: Systemprompte, Verhaltensrichtlinien und Modellparameter vollständig unter Ihrer Kontrolle.

Können Ollama-Modelle Bilder verarbeiten?

Ja. Llama 3.2 Vision, Qwen2-VL und Gemma 3 sind alle Multi-Modal. Laden Sie Bilder als lokale Dateien hoch; keine Cloud-Übertragung. Unterstützung: JPEG, PNG, GIF.

Wie aktualisiere ich auf neuere Ollama-Modellversionen?

Führen Sie `ollama pull [model-name]` erneut aus. Ollama lädt nur die Unterschiede herunter (Deduplizierung). Alte Versionen können gelöscht werden mit `ollama rm [model-name]:tag`.

Muss ich bei der Verwendung lokaler LLMs via Ollama die DSGVO beachten?

Ja. DSGVO Artikel 32 erfordert angemessene Sicherheitsmaßnahmen für personenbezogene Daten. Lokale Inferenz auf privaten Geräten oder Servern erfüllt Datenschutz-durch-Design-Anforderungen. Keine Cloud-Übertragung bedeutet: Datensouveränität, keine Datenexporte, Einhaltung von BSI-Grundschutz-Katalogen. Vorsicht: Wenn Sie ein Cloud-Modell verwenden, prüfen Sie zunächst die Datenverarbeitungsverträge.

Ist Ollama mit Open-Source-Modellen für den deutschen Mittelstand geeignet?

Ja. Kleine und mittlere Unternehmen (KMU) in Deutschland profitieren von: Datensouveränität (kein Cloud-Vendor Lock-in), Einhaltung von IT-Sicherheitsstandards (BSI IT-Grundschutz), Skalierbarkeit auf Standard-Hardware und Einsparungen durch keine API-Gebühren. Qwen3 7B läuft auf einer typischen Office-GPU; Llama 3.3 8B ist ein bewährtes Standard-Mittelstand-Modell für interne Tools, Customer-Service-Automation und Dokumentenverarbeitung.

Verwandte Lektüre

Quellen

Hinweis zu Drittanbieter-Fakten

Dieser Artikel referenziert KI-Modelle, Benchmarks, Preise und Lizenzen von Drittanbietern. Die KI-Landschaft verändert sich schnell. Benchmark-Werte, Lizenzbedingungen, Modellnamen und API-Preise können sich zwischen dem Zeitpunkt der Erstellung und dem Zeitpunkt ändern, zu dem Sie dies lesen. Bevor Sie Bereitstellungs- oder Compliance-Entscheidungen auf Basis dieses Artikels treffen, überprüfen Sie aktuelle Zahlen bei der offiziellen Quelle jedes Anbieters: Hugging-Face-Modellkarten für Lizenzen und Benchmarks, Anbieter-Websites für API-Preise und EUR-Lex für den aktuellen DSGVO- und EU-KI-Gesetz-Text. Dieser Artikel spiegelt öffentlich verfügbare Informationen vom Mai 2026 wider.

Nutzen Sie PromptQuorum mit einem lokalen LLM, eigenen API-Schlüsseln oder beidem — Sie wählen das Backend.

PromptQuorum-Warteliste beitreten →

← Zurück zu Lokale LLMs