Wichtigste Erkenntnisse
- Bestes Modell fuer Consumer-Hardware: Qwen 3.6 27B (77,2% SWE-bench, passt in 24 GB bei Q4). Ausgewogen: qwen3:30b.
- Am meisten heruntergeladen: Llama 3.2 3B (Tutorials) und die Llama-Familie.
- Bestes Reasoning: DeepSeek-R1 (Chain-of-Thought) und gpt-oss:20b (einstellbares Reasoning, ~o3-mini-Niveau).
- Bestes Coding: Kimi K2.6 (Frontier MoE), Qwen 3.6 27B (beste dicht), Devstral Small 24B (beste agentic), qwen3-coder:30b (Vervollstaendigung).
- Bestes kleines / 16 GB: gpt-oss:20b. Beste Vision/multimodal: Gemma 4 (E4B+). Bester Long-Context (10M) / grosse Multimodalitaet: Llama 4 Scout (~55 GB).
- Ollama-Bibliothek Juni 2026: 4.500+ Modelle. Alle über `ollama pull <name>` verfügbar.
Was ist neu in Ollama — Juni 2026 Update
Aktuelle Ollama-Version: v0.30.8 (veröffentlicht am 12. Juni 2026). Dies ist die neueste stabile Version, verfügbar über ollama.com/download. Aktualisieren Sie mit `curl https://ollama.ai/install.sh | sh` (macOS: `brew upgrade ollama`), dann bestätigen Sie mit `ollama --version`.
Was sich in der v0.30-Reihe geändert hat (Mai–Juni 2026): Ollama v0.30 hat die GGUF-Modellkompatibilität über llama.cpp erweitert und die Hardwareunterstützung über Apple Silicon hinaus ausgedehnt, und die MLX-Engine wurde am 11. Juni 2026 für die bislang schnellste Apple-Silicon-Inferenz verbessert — höhere Ausgabequalität bei geringerem Speicherbedarf. Point-Releases bis v0.30.8 fügten Gemma 4 QAT-Gewichte (5. Juni), Hermes Desktop (7. Juni), verbesserte Prompt-/KV-Cache-Wiederverwendung und Windows-Konfigurationspfad-Korrekturen hinzu. Vollständige Notizen: github.com/ollama/ollama/releases.
Neueste Modelle, die diesen Monat hinzugefügt wurden (Juni 2026):
- MiniMax M3 (MiniMax, 1. Juni 2026) — Neuestes Open-Weight-Flaggschiff: das erste Modell, das Frontier-Coding (SWE-Bench Pro 59.0), ein 1M-Token-Kontextfenster und native Bild-/Videoeingabe kombiniert. Wird in die Ollama-Bibliothek ausgerollt — Verfügbarkeit prüfen mit `ollama pull minimax-m3`.
- NVIDIA Nemotron 3 Ultra (NVIDIA, 4. Juni 2026) — Entwickelt für durchsatzstarkes Reasoning und langlaufende Agenten-Workflows. NVIDIA Open Model License. Pull: `ollama pull nemotron3-ultra`
- DeepSeek V4 Pro (DeepSeek, 23. April 2026) — Spezialist für algorithmisches Coding, 93.5% LiveCodeBench, MIT-Lizenz. Budget-Variante DeepSeek V4 Flash für leichtere Hardware. Pull: `ollama pull deepseek-v4-pro`
- Kimi K2.6 (Moonshot AI, 20. April 2026) — Frontier-Coding-Modell, SWE-Bench Pro 58.6, SWE-bench Verified 80.2%. MoE-Architektur (32B aktiv / 1T gesamt). Modified MIT-Lizenz.
- Qwen 3.6 27B (Alibaba, 16. April 2026) — Bestes Modell fuer Consumer-Hardware, 77,2% SWE-bench, Apache 2.0, passt in 24 GB bei Q4. Auch Qwen3.6-35B-A3B (MoE, 73,4 SWE-bench).
- GLM-5.1 (Z.ai, 7. April 2026) — 744B / 40B aktiv MoE, MIT-Lizenz, SWE-Bench Pro 58.4. Führender Structured Code Generator.
- gpt-oss (OpenAI, 2026) — Open-Weight MoE: gpt-oss:20b (21B gesamt / 3,6B aktiv, läuft in 16 GB, ~o3-mini-Niveau, einstellbares Reasoning) und gpt-oss:120b (80 GB).
- Gemma 4 (Google, 2. April 2026) — Multimodale Größen E2B / E4B / E12B (26B MoE) / E27B (31B dicht), alle mit Vision und Tool Calling. QAT-Gewichte hinzugefügt am 5. Juni 2026. E4B läuft in ~6 GB VRAM.
# Ollama auf die neueste Version aktualisieren (v0.30.8)
curl https://ollama.ai/install.sh | sh
# Oder auf Mac: brew upgrade ollama
# Aktuelle Version prüfen
ollama --version # Ausgabe: ollama version 0.30.8
# Die neuesten Juni-2026-Modelle pullen
ollama pull minimax-m3
ollama pull deepseek-v4-pro
ollama pull kimi-k2.6Die beliebtesten Modelle auf Ollama
Ollama verfügt über eine vollständig öffentlich zugängliche Download-Statistik. Nach Daten aus Juni 2026:
Llama 3.2 3B ist immer noch das am häufigsten heruntergeladene Modell insgesamt, großteils aufgrund seiner Verwendung als Standard-Testmodell beim ersten Install. Llama 4 Scout ist jedoch seit März 2026 schnell in den Rankings aufgestiegen und ist jetzt die bevorzugte Wahl für Qualität.
Qwen3 und Qwen 3.6 sind die am schnellsten wachsende Modellfamilie in der Ollama-Bibliothek, mit Qwen3 und dem neuen Qwen 3.6 dicht Variante schnell Qwen3 verdrängt. DeepSeek-R1 sah große Spitzen nach der Veröffentlichung und bleibt für Reasoning-Aufgaben stark heruntergeladen.
Llama 4 Scout wurde von Meta im April 2026 mit Scout (17B aktiv, 109B gesamt, MoE) und Maverick (17B aktiv, 400B gesamt) Varianten veröffentlicht. Llama 4 Scout ist jetzt stabil in der Ollama-Bibliothek (`ollama pull llama4:scout`). Die Llama 4 Familie nutzt Mixture-of-Experts (MoE) Architektur – nur 17B Parameter sind pro Token aktiv, aber mit 109B Gesamtparametern benötigt Scout ~55 GB VRAM bei Q4 (passt in 24 GB nur bei 1,78-Bit, ~20 tok/s). Scouts Stärken sind das 10M-Token-Kontextfenster und multimodale Eingabe, nicht die Consumer-Hardware-Tauglichkeit. Für leichte Setups (8 GB RAM) bleibt Llama 3.2 3B das einfachste Einstiegsmodell. Das Ollama-Ökosystem expandierte erheblich im April 2026. Kimi K2.6 (Moonshot AI, Modified MIT-Lizenz, 32B aktiv / 1T gesamt MoE) erreichte SWE-Bench Pro 58.6 und liegt damit gleichauf mit GPT-5.5. Qwen 3.6 27B erzielte 77,2% SWE-bench als das beste Modell fuer Consumer-Hardware (passt in 24 GB bei Q4). OpenAIs Open-Weight gpt-oss:20b (21B gesamt / 3,6B aktiv MoE) läuft in 16 GB auf ~o3-mini-Niveau mit einstellbarem Reasoning. Das aktuelle Release, Ollama v0.30.8 (12. Juni 2026), erweitert die GGUF-Hardwareunterstützung über llama.cpp und verbessert die Apple-Silicon-MLX-Engine. Die Ollama-Bibliothek referenziert jetzt 4.500+ Modelle, wobei MiniMax M3, NVIDIA Nemotron 3 Ultra und DeepSeek V4 Pro die neuesten Ergänzungen in diesem Monat sind.
Top-Modelle nach Kategorie
Die Qualität der Modellausgabe hängt stark davon ab, wie Sie prompten. Für strukturierte Techniken, die mit allen lokalen Modellen funktionieren — darunter Chain-of-Thought, Few-Shot-Beispiele und Output-Formatierung — siehe den Prompt-Engineering-Guide. Für Reasoning-Aufgaben verbessert Chain-of-Thought-Prompting erheblich DeepSeek-R1 und Qwen3 Output-Qualität. Für Quantisierungskompromisse dieser Modelle siehe den Quantisierungsleitfaden →. Um zu ermitteln, wie viel VRAM jedes Modell benötigt, siehe den VRAM-Anforderungsleitfaden →. Für Agent-Workflows mit Gemma 4 siehe Tree-of-Thought und ReAct. Sobald ein Tool-Calling-Modell aus dieser Liste in einer mehrstufigen Schleife mit Datei- und Datenbankzugriff läuft, siehe Lokale KI-Agenten mit MCP für das Open-Source-Orchestrierungsmuster.
- Allgemeines Chat (Anfänger): `ollama run llama3.2:3b` -- die meiste Dokumentation, am besten unterstütztes Einstiegsmodell.
- Allgemeines Chat (beste Wahl): `ollama run qwen3.6:27b` -- 77,2% SWE-bench, bestes Modell fuer Consumer-Hardware, passt in 24 GB bei Q4. Ausgewogen: `ollama run qwen3:30b`. Für 8 GB Maschinen `ollama run llama3.2:3b` verwenden.
- Long-Context / multimodal: `ollama run llama4:scout` -- 10M-Token-Kontext + multimodal, MoE (17B aktiv/109B gesamt). Benötigt ~55 GB VRAM bei Q4 (passt in 24 GB nur bei 1,78-Bit, ~20 tok/s).
- Bestes kleines / 16 GB: `ollama run gpt-oss:20b` -- 21B gesamt / 3,6B aktiv MoE, ~o3-mini-Niveau, einstellbares Reasoning. Größer: `ollama run gpt-oss:120b` (80 GB).
- Codierung (7B): `ollama run qwen3:8b` -- 76% HumanEval, verbessert gegenüber Qwen3, mehrsprachig.
- Codierung (bestes Agentic, 24B): `ollama run devstral-small:24b` -- Bestes Agentic Coding-Modell (Multi-Datei-Edits, Debugging). 16 GB RAM. Von Mistral AI.
- Codierung (bestes Dicht, 27B): `ollama run qwen3.6:27b` -- 77,2% SWE-bench. Bestes dichtes Coding-Modell. 22 GB VRAM.
- Codierung (Frontier MoE): `ollama run kimi-k2.6` -- SWE-Bench Pro 58.6 (gleichauf mit GPT-5.5), Top-Tier. MoE (32B aktiv/1T gesamt). Modified MIT-Lizenz. Benötigt Quantisierung für Consumer-Hardware.
- Agent-Aufgaben und Tool-Calling: `ollama run gemma4:e4b` -- Veröffentlicht 2. April 2026. Built-in Tool-Calling + Vision-Unterstützung. Empfohlen für lokale Agenten, Function-Calling und strukturierte Ausgabe. 6 GB RAM.
- Reasoning und Mathematik: `ollama run deepseek-r1:7b` -- Chain-of-Thought-Modell, beste lokale Mathe-Leistung bei 7B.
- Mehrsprachig: `ollama run qwen3:7b` -- 29+ native Sprachen, stärkste nicht-englische Unterstützung, 76% HumanEval.
- Bildverarbeitung: `ollama run gemma4:e4b` -- Vision + Tool Calling (Juni 2026). Oder `ollama run llama3.2-vision:11b` für dedizierte Vision.
- Schnell und leichtgewichtig: `ollama run gemma2:2b` -- schnellste CPU-Inferenz, 1,7 GB RAM.
- Hohe Qualität (16 GB RAM): `ollama run mistral-small3.1` -- nahe 70B Qualität bei 14 GB RAM.
- Heimautomatisierung / Wake-Word-KI: `ollama run phi4-mini` — Phi-4 Mini (3.8B, ~3 GB VRAM) verarbeitet Home Assistant Sprachbefehle mit 20–25 Tok/Sek auf einem Mini-PC ohne dedizierte GPU. Siehe Home Assistant + Ollama Integrationsguide →.
DeepSeek-R1: Reasoning-Durchbruch
DeepSeek-R1 wurde im Januar 2025 veröffentlicht und verkörpert einen signifikanten Fortschritt im Reasoning auf lokalen Größen. Das Modell führt explizite Chain-of-Thought (CoT) Reasoning durch: Sie sehen die internen Gedankenketten des Modells, bevor die endgültige Antwort gegeben wird.
- Größen verfügbar: 1,5B (mobil), 7B, 70B. 1,5B ist für Bildungsgeräte ausreichend; 7B übertrifft Llama 3.3 13B bei Mathematik.
- Leistung auf Benchmarks: 52 % bei MATH (gegenüber 23 % Llama 3.3 8B), verbesserte Logik und mehrschrittige Problemlösung.
- RAM-Anforderungen: 1,5B: 2 GB, 7B: 6 GB, 70B: 44 GB (Q4-Quantisierung).
- Lizenz: Deepseek-Lizenzen (einige Einschränkungen bei Decompilation; überprüfen Sie vor Enterprise-Einsatz).
- EU-Datenhandhabung: Bei Einsatz in EU-Regionen verarbeitet DeepSeek-R1 Daten gemäß EU-Datenschutzbestimmungen. Lokale Ausführung auf privaten Servern oder Geräten gewährleistet Datensouveränität -- keine Cloud-Übertragung erforderlich.
ollama run deepseek-r1:7b
# Beispielprompt: "Wenn zwei Züge sich einer Station mit 100 km/h nähern, wann treffen sie sich?"
# DeepSeek-R1:7b antwortet mit sichtbaren Gedankenketten:
# <Gedanken>
# ...Pfade erkunden, Annahmen überprüfen...
# </Gedanken>
# Antwort: Sie treffen sich ...Vision-Modelle auf Ollama
Juni 2026: Diese Modelle auf Ollama unterstützen Bildeingabe (multimodal). Gemma 4 unterstützt sowohl Vision ALS AUCH Tool Calling – einzigartig unter Vision-Modellen auf Ollama.
| Modell | RAM | Bildunterstützung | Ollama Befehl |
|---|---|---|---|
| llama3.2-vision:11b | ~8 GB | Ja | ollama run llama3.2-vision:11b |
| llama3.2-vision:90b | ~55 GB | Ja | ollama run llama3.2-vision:90b |
| gemma3:9b (vision) | ~6 GB | Ja | ollama run gemma3:9b |
| minicpm-v:8b | ~5,5 GB | Ja | ollama run minicpm-v |
| gemma4:e4b | ~6 GB | Ja ✓ | ollama run gemma4:e4b |
Vollständiger Top-10-Vergleich
Download-Zählungen bevorzugen immer noch Llama 3.x aufgrund der Häufigkeit von Tutorials. Für neue Projekte im Juni 2026 sind Qwen 3.6 27B (bestes Modell fuer Consumer-Hardware), Kimi K2.6, gpt-oss:20b und qwen3:30b zu bevorzugen.
| # | Modell | Beste für | RAM | HumanEval |
|---|---|---|---|---|
| 1 | Qwen 3.6 27B | Bestes Modell fuer Consumer-Hardware | 24 GB (Q4) | 77,2% SWE-bench |
| 2 | Kimi K2.6 | Frontier-Coding, MoE (32B/1T), Modified MIT | Quantisiert | 58,6 SWE-Bench Pro |
| 3 | gpt-oss:20b | Bestes kleines / 16 GB, einstellbares Reasoning | 16 GB | ~o3-mini |
| 4 | qwen3:30b | Ausgewogen; qwen3-coder:30b für Code | ~18 GB | stark |
| 5 | Devstral Small 24B | Agentic Codierung (Multi-Datei) | 16 GB | 80% |
| 6 | deepseek-r1:7b | Reasoning, Mathe | 5 GB | — |
| 7 | gemma4:e4b | Vision + Tool Calling (multimodal) | ~6 GB | — |
| 8 | Llama 4 Scout | Long-Context 10M + multimodal, MoE | ~55 GB (Q4) | 85% |
| 9 | mistral-small3.1 | Qualität bei 16 GB | 14 GB | 74% |
| 10 | Llama 3.2 3B | Einstiegsmodell, allgemeiner Chat | 2,5 GB | 60% |
Wie durchsuchen Sie die Ollama-Bibliothek?
Es gibt zwei Möglichkeiten, mit Ollama-Modellen zu arbeiten. Installierte Modelle wechseln: In der Ollama Mac-App klicken Sie auf den Modell-Dropdown-Button am unteren Rand des Chat-Eingabefeldes (zeigt den aktuellen Modellnamen, z. B. "llama4:scout"), um zwischen lokal installierten Modellen zu wechseln. Neue Modelle finden und herunterladen: Besuchen Sie ollama.com/library, um 4.500+ Modelle nach Kategorie zu durchsuchen, und nutzen Sie dann die CLI-Befehle unten zum Herunterladen.
- Öffnen Sie https://ollama.ai/library in einem Webbrowser für die vollständige durchsuchbare Bibliothek aller 4.500+ Modelle.
- Filteroptionen: Modellgröße, Lizenz, Veröffentlichungsdatum, Benchmarks (MMLU, HumanEval, MATH).
- Ratings pro Modell: Nutzer-Downloads, GitHub-Sterne (für das Basis-Modell), Ollama-Sterne.
- Neue Modelle: Ollamás Bibliothek wird kontinuierlich aktualisiert (neue Modelle erscheinen Tage nach der Veröffentlichung).
ollama list
# Zeigt alle installierten Modelle an
ollama pull llama4:scout
# Lädt Llama 4 Scout herunter (beste Qualität, MoE)
ollama pull qwen3.6:27b
# Lädt Qwen 3.6 27B herunter (Best Coding Model, 77,2% SWE-bench)
ollama run llama4:scout
# Startet eine interaktive Chat-Sitzung
ollama run -m deepseek-r1:7b "Lösen Sie 2^10"
# Löst Reasoning-Aufgaben mit CoT ausHäufige Fehler bei der Auswahl von Ollama-Modellen
Ich habe einen großen Modell-Tag gepullt, aber mein RAM ist voll. Was ist passiert?
Zu schnell gepullt, ohne den RAM zu überprüfen. Verwenden Sie `ollama show [model-name]` BEVOR Sie pullen. Beispiel: `ollama show llama3.1:70b` zeigt RAM-Anforderungen an (~42-48 GB mit Q4-Quantisierung). Für Anfänger: Bleiben Sie bei 7B-13B-Modellen (unter 16 GB RAM). Löschen Sie mit `ollama rm [model-name]`.
Ich verwende ein Allzweck-Modell wie Llama 3.3, aber die Codierung ist langsam. Warum?
Llama 3.3 8B ist Allzweck-freundlich, aber Qwen3 oder Mistral Small sind für technische Aufgaben spezialisiert. Für Codierung: Schalten Sie zu Qwen3 7B um (75,4 % HumanEval gegenüber 68,2 % für Llama). Beide laufen unter 8 GB RAM.
Ich habe ein Modell gepullt, sehe es aber nicht in der Liste. Wie überprüfe ich die Installation?
Führen Sie `ollama list` aus. Ollama speichert Modelle unter `~/.ollama/models/` (Mac) oder `%USERPROFILE%.ollamamodels` (Windows). Wenn sich das Modell dort befindet, aber nicht in der Liste angezeigt wird, neustarten Sie den Ollama-Daemon: Beenden Sie Ollama und öffnen Sie es erneut.
Nächste Schritte
- Beste lokale LLMs für Coding — Das beste Ollama-Modell speziell für Code-Aufgaben →
- Beste LLMs ohne GPU (CPU-only) — Kein Grafikprozessor? Hier starten →
- Hardware-Guide für lokale LLMs 2026 — Unsicher, ob dein PC diese Modelle ausführen kann? →
Häufig gestellte Fragen
Wie viel RAM brauche ich für ein lokales Modell?
7B-Modelle benötigen 6,5-8 GB RAM. 13B-Modelle: 11-14 GB. 70B-Modelle: 42-48 GB mit Quantisierung (Q4_K_M). Kleiner (3B): 2-3 GB. Überprüfen Sie mit `ollama show [model-name]` vor dem Herunterladen.
Kann ich Ollama-Modelle offline ausführen?
Ja. Nach dem initialen Download läuft jede Inferenz lokal, ohne Internetverbindung. Ollama überprüft gelegentlich Updates (aber nicht automatisch angewendet).
Welches Modell hat die beste deutsche Sprachunterstützung?
Qwen3 / Qwen 3.6 27B hat überlegene deutsche Unterstützung (trainiert auf CulturaX und DE-Wikitext). Llama 3.3 ist für Deutsch angemessen, aber Qwen ist präziser. Devstral Small 24B (Mistral AI, französisches Unternehmen, Apache 2.0) ist für Deutsch und Französisch kompetent.
Sind Ollama-Modelle wirklich kostenlos?
Ja. Alle auf Ollama verfügbaren Modelle sind Open-Source mit freien Lizenzen (Apache 2.0, Meta Llama 3 Community, Deepseek). Keine Abonnements, keine API-Gebühren. Laden Sie herunter, installieren Sie lokal, und verwenden Sie unbegrenzt.
Wie schnell ist DeepSeek-R1 wirklich?
Erzeugungsgeschwindigkeit: 15-25 Token/Sek. auf M1 Pro (ähnlich wie Llama 3.3 7B). Die Gesamtlatenz ist höher, weil Gedankenketten ausgegeben werden -- erwarten Sie 8-12 Sekunden für mittlere Anfragen. Für Echtzeit-Interaktion nutzen Sie Llama 3.3 oder Mistral.
Warum sollte ich Ollama verwenden und nicht einfach ChatGPT Plus?
Datenschutz: Keine Chats an OpenAI übertragen. Kosten: Kein monatliches Abonnement; eine GPU-Einmalinvestition. Offline: Funktioniert vollständig ohne Internet. Anpassbar: Systemprompte, Verhaltensrichtlinien und Modellparameter vollständig unter Ihrer Kontrolle.
Können Ollama-Modelle Bilder verarbeiten?
Ja. Llama 3.2 Vision, Qwen2-VL und Gemma 3 sind alle Multi-Modal. Laden Sie Bilder als lokale Dateien hoch; keine Cloud-Übertragung. Unterstützung: JPEG, PNG, GIF.
Wie aktualisiere ich auf neuere Ollama-Modellversionen?
Führen Sie `ollama pull [model-name]` erneut aus. Ollama lädt nur die Unterschiede herunter (Deduplizierung). Alte Versionen können gelöscht werden mit `ollama rm [model-name]:tag`.
Muss ich bei der Verwendung lokaler LLMs via Ollama die DSGVO beachten?
Ja. DSGVO Artikel 32 erfordert angemessene Sicherheitsmaßnahmen für personenbezogene Daten. Lokale Inferenz auf privaten Geräten oder Servern erfüllt Datenschutz-durch-Design-Anforderungen. Keine Cloud-Übertragung bedeutet: Datensouveränität, keine Datenexporte, Einhaltung von BSI-Grundschutz-Katalogen. Vorsicht: Wenn Sie ein Cloud-Modell verwenden, prüfen Sie zunächst die Datenverarbeitungsverträge.
Ist Ollama mit Open-Source-Modellen für den deutschen Mittelstand geeignet?
Ja. Kleine und mittlere Unternehmen (KMU) in Deutschland profitieren von: Datensouveränität (kein Cloud-Vendor Lock-in), Einhaltung von IT-Sicherheitsstandards (BSI IT-Grundschutz), Skalierbarkeit auf Standard-Hardware und Einsparungen durch keine API-Gebühren. Qwen3 7B läuft auf einer typischen Office-GPU; Llama 3.3 8B ist ein bewährtes Standard-Mittelstand-Modell für interne Tools, Customer-Service-Automation und Dokumentenverarbeitung.
Verwandte Lektüre
- Lokale LLMs mit VS Code und Cursor installieren -- VS Code und Cursor erkennen jetzt Ollama automatisch.
- So wählen Sie ein lokales Modell: Llama vs. Qwen vs. Mistral -- Vollständiger Vergleich für Anfänger.
- Ollama vs. LM Studio: Welches ist schneller? -- GPU-Benchmarks und Durchsatzvergleiche.
- Wie installieren Sie Ollama auf Windows/Mac -- Schritt-für-Schritt-Installations- und Umgebungskonfiguration.
- Hardware für lokale LLMs: GPU-Anforderungen 2026 -- Welche GPU, RAM und Speicher für Ihr Modell erforderlich ist.
- Troubleshooting: Ollama-Fehler und Lösungen -- CUDA, MPS, CPU-Fallback und häufige Fehler.
- Lokale LLM-Modell-Updates 2026 -- vollständige Zeitleiste aller wichtigen Open-Weight-Releases mit Ollama-Verfügbarkeitsdaten.
Quellen
- Ollama-Modellbibliothek -- Alle 4.500+ Modelle mit Live-Download-Statistiken.
- Ollama GitHub: Beliebte Modelle nach Downloads -- Monatliche Einträge zu Benutzern und Download-Trends (öffentliche Daten).
- DeepSeek-R1 Whitepaper -- "DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning" (Januar 2025).
- Gemma 3 Announcement -- Google Blog: Gemma 3 Multimodal, 128K Kontext, Februar 2026.