Schnelle Antworten zu lokalen LLM-Fragen
67 Kurzantwort-Leitfäden. VRAM-Anforderungen, Ollama-Empfehlungen, Hardware-Vergleiche und Setup-Tipps — in 60 Sekunden beantwortet.
| VRAM | Bestes Modell (Mai 2026) | Quantisierung | Anwendungsfall |
|---|---|---|---|
| 4 GB | Phi-4 Mini | Q4 | Einfacher Chat, kleine Aufgaben |
| 6 GB | Llama 3 8B | Q4_K_M | Täglicher Chat und Coding |
| 8 GB | Mistral 7B | Q5_K_M | Qualitäts- und Geschwindigkeitsausgleich |
| 12 GB | Qwen 14B | Q4_K_M | Coding und Reasoning |
| 16 GB | Qwen 32B | Q4_K_M | Komplexe mehrstufige Aufgaben |
| 24 GB | Llama 70B | Q4_K_M (partiell) | Qualität nahe Produktion |
| 48+ GB | Llama 70B | Q5_K_M oder höher | Vollpräzisions-Modelle |
AQuantisierung & VRAM
Wie viel Speicher Sie benötigen, welches Quantisierungsformat Sie wählen und VRAM-Entscheidungsbäume.
Wie viel VRAM brauchen Sie für ein lokales LLM?
Was ist Q4_K_M-Quantisierung?
Q4_K_M vs. Q8_0: Was sollten Sie wählen?
Beste Ollama-Modelle für RTX 3060 12 GB?
Beste Ollama-Modelle für 4 GB VRAM?
Wie viel RAM braucht ein 7B-Modell?
Wie viel VRAM braucht ein 70B-Modell?
Bestes lokales LLM für 6 GB VRAM?
BOllama
Neueste Versionen, beste Modelle, Kontextfenster, Vision und CPU-only-Nutzung.
CTool-Vergleiche
Zweiseitige Vergleiche: Ollama vs. LM Studio, Jan vs. LM Studio, Qwen vs. DeepSeek.
Qwen Coder vs. DeepSeek Coder: Welcher ist besser?
Qwen 3 Coder gewinnt bei Python und TypeScript.
Jan vs LM Studio: Welches ist besser?
Jan ist vollständig Open Source mit einem Erweiterungssystem.
Bestes Frontend für Ollama?
Open WebUI ist das beste Ollama-Frontend für die meisten Nutzer.
Ollama-Modelle in das MLX-Format konvertieren
Sie können Ollama-Modelle nicht direkt in MLX konvertieren.
Unterstützt Ollama MLX auf Apple Silicon?
Nein.
DModell-Vergleiche
Beste 14B-Modelle, MoE-Modelle, Mini-PCs und direkte Modell-Vergleiche.
EHardware-Spezifisch
Hardware-Empfehlungen und Kaufleitfäden: GPU-Empfehlungen nach Budget, Mini-PCs, SSDs, Cloud-GPUs und eGPUs.
FSchnelle Antworten
Ja/Nein- und Einzahlungsantworten: RAM-Grenzen, Laptop-Empfehlungen.
GPrompt Engineering
Schnelle Definitionen und Bestenlisten für Prompt-Engineering-Konzepte.
HDatenschutz & Compliance
DSGVO-Konformität, Datensouveränität und datenschutzkonforme lokale KI-Bereitstellung.