Kann man auf einem Xperia ein lokales LLM ausführen?
Schnelle Antwort
Ja — das Xperia 1 VI (12 GB RAM, Snapdragon 8 Gen 3) kann Rinna 3.6B und Phi-4 Q4 über MLC Chat ausführen. Das Xperia 5 V (8 GB) schafft leichte Modelle. Das Xperia 10 VI (6 GB) läuft nur TinyLlama und Gemma 2B.
- ▸Xperia 1 VI: 12 GB RAM — läuft Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B
- ▸Xperia 5 V: 8 GB RAM — läuft Rinna 3.6B und Gemma 2B Q4
- ▸Xperia 10 VI: 6 GB RAM — nur TinyLlama und Gemma 2B
- ▸Sony enthält keine Galaxy-AI-ähnlichen Funktionen — lokale LLM via MLC Chat schließt diese Lücke
Aktualisiert: 2026-05
Wichtigste Punkte
- ✓Das Xperia 1 VI (12 GB RAM, Snapdragon 8 Gen 3) ist das einzige Xperia, das zuverlässig 7B+-Modelle ausführt — ideal für Phi-4 Q4 und Qwen2.5-3B
- ✓Das Xperia 5 V (8 GB RAM) unterstützt 3B-Modelle wie Rinna 3.6B und Gemma 2B Q4 problemlos
- ✓Das Xperia 10 VI (6 GB RAM) ist auf Sub-2B-Modelle beschränkt — TinyLlama 1.1B und Gemma 2B sind die praktische Obergrenze
- ✓Sony liefert keine On-Device-KI-Funktionen — MLC Chat oder PocketPal AI aus dem Google Play Store ist der praktische Ersatz
- ✓Akkuverbrauch liegt bei etwa 15 % pro Stunde bei aktiviertem Bildschirm und kontinuierlicher Inferenz auf dem Xperia 1 VI; Flugmodus aktivieren reduziert den Verbrauch
Kompatibilität nach Xperia-Modell
Stand Mai 2026 unterstützen drei aktuelle Xperia-Modelle lokale LLM-Inferenz, wobei die Leistungsfähigkeit vollständig durch RAM und Chipsatz bestimmt wird — das Xperia 1 VI führt, das Xperia 5 V deckt den mittleren Bereich ab und das Xperia 10 VI ist auf kleinste Modelle begrenzt. Sony installiert keine On-Device-KI-Assistenten vor (anders als Samsung Galaxy AI), daher sind lokale LLM-Apps der einzige Weg zu privatem, offlinenem KI auf Xperia-Geräten.
Das Xperia 1 VI ist das einzige Xperia, das quantisierte 7B+-Modelle ausführen kann. Sein Snapdragon 8 Gen 3 SoC und 12 GB LPDDR5X RAM geben ihm Spielraum für Phi-4 Q4 (14B quantisiert auf ~8 GB) und Qwen2.5-3B neben dem normalen App-Betrieb. Das Xperia 5 V mit Snapdragon 8 Gen 2 und 8 GB RAM ist der Sweet Spot für 3B-Modelle — Rinna 3.6B und Gemma 2B Q4 laufen zuverlässig. Das Xperia 10 VI verwendet den Mid-Range Snapdragon 6 Gen 1 mit nur 6 GB RAM; auf dieser Stufe bei TinyLlama 1.1B oder Gemma 2B bleiben — größere Modelle werden beim Laden abstürzen oder OOM-Fehler verursachen.
Xperia 1 VI für 7B+-Modelle verwenden; Xperia 5 V für 3B-Modelle; auf dem Xperia 10 VI bei Sub-2B-Modellen bleiben.
Anleitungen zur App-Einrichtung finden Sie in unserem Android-LLM-Apps für Japan Guide.
| Xperia-Modell | RAM / Chip | Empfohlene Modelle |
|---|---|---|
| Xperia 1 VI | 12 GB / Snapdragon 8 Gen 3 | Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B |
| Xperia 5 V | 8 GB / Snapdragon 8 Gen 2 | Rinna 3.6B, Gemma 2B Q4 |
| Xperia 10 VI | 6 GB / Snapdragon 6 Gen 1 | TinyLlama 1.1B, Gemma 2B nur |
Einrichtung in 3 Schritten
Die Installation eines lokalen LLM auf einem Xperia dauert drei Schritte und unter 30 Minuten einschließlich Modell-Download-Zeit. Der Prozess erfordert keinen Root-Zugang, keinen Entwicklermodus und keine speziellen Xperia-Einstellungen — er läuft vollständig über Standard-Android-App- und Dateiverwaltung.
Schritt 1: MLC Chat oder PocketPal AI aus dem Google Play Store installieren. Beide sind kostenlos und in Japan ohne VPN oder Region-Umgehung verfügbar. MLC Chat ist schneller bis zur ersten Inferenz; PocketPal AI unterstützt eine breitere Palette von GGUF-Modelldateien von Hugging Face.
Schritt 2: Modell über WLAN herunterladen. TinyLlama 1.1B Q4 ist ca. 0,7 GB, Rinna 3.6B Q4 ca. 2 GB, Gemma 2B Q4 ca. 1,5 GB und Phi-4 Q4 ca. 8 GB. Für Phi-4 ein Xperia mit 128 GB oder mehr Speicher verwenden. Vor dem Start von Phi-4 Q4 alle anderen Apps schließen — es benötigt ca. 8 GB des verfügbaren 12 GB RAMs und braucht maximalen Arbeitsspeicher zum Laden. Download über mobile Daten vermeiden.
Schritt 3: Tastatur auf japanische Eingabe umstellen. Gboard mit aktiviertem Japanisch oder ATOK funktionieren beide direkt mit MLC Chat und PocketPal AI — man tippt auf Japanisch, das Modell antwortet auf Japanisch. Keine zusätzliche Konfiguration für japanische Spracheingabe erforderlich.
Akkuhinweis: Beim Xperia 1 VI ist mit ca. 15 % Akkuverbrauch pro Stunde bei aktiviertem Display und kontinuierlicher Inferenz zu rechnen. Flugmodus aktivieren reduziert den Hintergrundradio-Verbrauch. Sony Xperia AI Agent (aktuell in der Beta) verbindet sich mit Cloud-KI-Diensten — für vollständige On-Device-Verarbeitung ohne Datenweitergabe ist MLC Chat der einzige Weg. Vollständige Anleitung: KI auf Tablets und Android-Geräten ausführen.