Die besten lokalen LLM-Apps für Android?

Lesen auf:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

Schnelle Antwort

Die besten Android-Apps für den lokalen LLM-Betrieb sind MLC Chat, Pocketpal und Termux mit Ollama. MLC Chat ist am einfachsten für Einsteiger. Alle laufen vollständig offline.

▸MLC Chat: einfachste Einrichtung, voroptimierte Modelle für Android
▸Pocketpal: flexibles GGUF-Modell-Laden
▸Termux + Ollama: vollständiges Ollama auf Android, benötigt 8+ GB RAM

Aktualisiert: 2026-05

Tool Comparisons

Wichtigste Punkte

✓MLC Chat ist der einfachste Einstieg für Android-LLMs — aus Google Play installieren, Modell auswählen, sofort offline nutzen
✓Pocketpal unterstützt das Laden beliebiger GGUF-Dateien von Hugging Face und bietet Power-Usern volle Modellflexibilität auf Android
✓Termux + Ollama bringt die vollständige Ollama-CLI auf Android, erfordert aber ein Gerät mit 8+ GB RAM und Terminal-Kenntnisse
✓Android benötigt 8 GB RAM für 7B-Modelle und mindestens 4 GB RAM für 2–4B-Modelle — vor der Installation Gerätespezifikationen prüfen

Die drei funktionierenden Optionen

Technischen Tiefen-Dive gesucht? Benchmarks, NPU-Geschwindigkeitsdaten auf echten Geräten und alle 6 Android-LLM-Apps im Vergleich: ausführlicher technischer Android-LLM-Leitfaden. Diese Seite liefert die schnelle Installationsempfehlung.

Stand Mai 2026 gibt es drei praktische Möglichkeiten, ein lokales LLM auf Android zu betreiben: MLC Chat (Machine Learning Compilation), Pocketpal AI und Termux mit Ollama. Alle drei laufen nach dem ersten Modell-Download zu 100 % offline — kein API-Key oder Internetzugang erforderlich.

MLC Chat verwendet das MLC-LLM-Kompilierungsframework, um Modellgewichte für mobile Hardware vorzuoptimieren. Sie laden es aus dem Google Play Store herunter, wählen ein unterstütztes Modell (Llama 3, Gemma, Phi) aus, und das Modell wird direkt auf dem Gerät heruntergeladen und ausgeführt. Die Einrichtung dauert unter 10 Minuten.

Pocketpal AI wurde von der Hugging-Face-Community entwickelt und unterstützt das direkte Laden von GGUF-Modelldateien von Hugging Face. Das bedeutet, dass Sie ein beliebiges GGUF-kompatibles Modell ausführen können, nicht nur eine vordefinierte Liste. Der Kompromiss ist eine etwas komplexere Einrichtung mit manueller Modellauswahl und -download.

App	Einrichtungsaufwand	Modellflexibilität
MLC Chat	Einfach (Play Store)	Nur voroptimierte Modelle
Pocketpal	Mittel	GGUF from Hugging Face
Termux + Ollama	Fortgeschritten (CLI)	Vollständige Ollama-Bibliothek

Welche App zuerst installieren

Beginnen Sie mit MLC Chat, wenn dies Ihr erstes Android-LLM-Setup ist — es hat die schnellste Zeit bis zum ersten Token und die wenigste Konfiguration. Pocketpal ist der Upgrade-Pfad für Nutzer, die häufig Modelle wechseln möchten. Termux + Ollama ist für Entwickler, die Ollama bereits kennen und denselben CLI-Workflow auf dem Mobilgerät nutzen wollen.

Ein Android-Flaggschiff mit 8+ GB RAM verarbeitet ein 2–3B-Modell mit 4–8 tok/s auf der CPU. Mittelklasse-Handys aus 2023–2024 sind langsamer (1–3 tok/s) — für Batch-Aufgaben nutzbar, für Live-Chat frustrierend. Versuchen Sie keine 7B-Modelle auf Geräten mit weniger als 8 GB RAM.

Termux + Ollama ist die leistungsstärkste Option, hat aber die steilste Einrichtungskurve. Sie installieren Termux von F-Droid und führen dann pkg install ollama im Terminal aus. Nach der Installation funktionieren alle Standard-Ollama-Befehle, einschließlich ollama pull und ollama run. Dieser Ansatz eignet sich am besten für Entwickler, die Ollama bereits auf dem Desktop verwenden.

Der Akkuverbrauch spielt ab dem 7B-Bereich eine Rolle. Eine 30-minütige Chat-Session mit Llama 3 8B Q4 auf einem Flaggschiff-Handy verbraucht im Durchschnitt 8–12 % Akku. Für häufigen Einsatz am Ladekabel bleiben oder auf 2–3B-Modelle wie Phi-3 Mini und Gemma 2B wechseln, die weniger Strom benötigen.

Ausführliche Benchmarks, NPU-Daten auf echten Android-Geräten und Quantisierungsvergleiche gewünscht? Dann der technische Android-LLM-Tiefen-Leitfaden.

Für Japan-spezifische App-Optionen mit Xperia- und AQUOS-Geräteunterstützung, lesen Sie unseren Leitfaden für die besten Android-LLM-Apps in Japan.

Schnelle Antworten zu Android-LLM-Apps

Funktioniert MLC Chat auf allen Android-Handys?▾

MLC Chat erfordert Android 10 oder höher und mindestens 4 GB RAM. Für 7B-Modelle werden 8 GB RAM empfohlen. Die App ist im Google Play Store verfügbar und unterstützt die Modellfamilien Llama, Gemma und Phi.

Kann ich Pocketpal AI ohne Hugging-Face-Konto verwenden?▾

Ja. Pocketpal AI kann GGUF-Modelle aus öffentlichen Hugging-Face-Repositories ohne Konto herunterladen. Ein Hugging-Face-Konto wird nur für private oder zugangsbeschränkte Modell-Repositories benötigt.

Wie installiere ich Ollama auf Android über Termux?▾

Installieren Sie Termux von F-Droid (nicht von Google Play — die Play-Store-Version ist veraltet). Führen Sie in Termux pkg update && pkg install ollama aus. Verwenden Sie dann Standard-Ollama-Befehle: ollama pull llama3 und ollama run llama3. Ihr Gerät benötigt 8+ GB RAM für einen zuverlässigen Betrieb.

Welche Android-LLM-App eignet sich am besten für Einsteiger?▾

MLC Chat ist der beste Einstiegspunkt. Es installiert sich aus dem Google Play Store in unter einer Minute, bietet eine kuratierte Liste voroptimierter Modelle und erfordert keine Terminal-Kenntnisse. Den besten Ollama-Frontend-Vergleich finden Sie dort, wenn Sie eine reichhaltigere Chat-Oberfläche bevorzugen.

← Zurück zu Prompt-Häppchen