Skip to main content
PromptQuorumPromptQuorum

Kann man auf einem Xperia ein lokales LLM ausführen?

Schnelle Antwort

Ja — das Xperia 1 VI (12 GB RAM, Snapdragon 8 Gen 3) kann Rinna 3.6B und Phi-4 Q4 über MLC Chat ausführen. Das Xperia 5 V (8 GB) schafft leichte Modelle. Das Xperia 10 VI (6 GB) läuft nur TinyLlama und Gemma 2B.

  • Xperia 1 VI: 12 GB RAM — läuft Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B
  • Xperia 5 V: 8 GB RAM — läuft Rinna 3.6B und Gemma 2B Q4
  • Xperia 10 VI: 6 GB RAM — nur TinyLlama und Gemma 2B
  • Sony enthält keine Galaxy-AI-ähnlichen Funktionen — lokale LLM via MLC Chat schließt diese Lücke

Aktualisiert: 2026-05

Hardware Guides

Wichtigste Punkte

  • Das Xperia 1 VI (12 GB RAM, Snapdragon 8 Gen 3) ist das einzige Xperia, das zuverlässig 7B+-Modelle ausführt — ideal für Phi-4 Q4 und Qwen2.5-3B
  • Das Xperia 5 V (8 GB RAM) unterstützt 3B-Modelle wie Rinna 3.6B und Gemma 2B Q4 problemlos
  • Das Xperia 10 VI (6 GB RAM) ist auf Sub-2B-Modelle beschränkt — TinyLlama 1.1B und Gemma 2B sind die praktische Obergrenze
  • Sony liefert keine On-Device-KI-Funktionen — MLC Chat oder PocketPal AI aus dem Google Play Store ist der praktische Ersatz
  • Akkuverbrauch liegt bei etwa 15 % pro Stunde bei aktiviertem Bildschirm und kontinuierlicher Inferenz auf dem Xperia 1 VI; Flugmodus aktivieren reduziert den Verbrauch

Kompatibilität nach Xperia-Modell

Stand Mai 2026 unterstützen drei aktuelle Xperia-Modelle lokale LLM-Inferenz, wobei die Leistungsfähigkeit vollständig durch RAM und Chipsatz bestimmt wird — das Xperia 1 VI führt, das Xperia 5 V deckt den mittleren Bereich ab und das Xperia 10 VI ist auf kleinste Modelle begrenzt. Sony installiert keine On-Device-KI-Assistenten vor (anders als Samsung Galaxy AI), daher sind lokale LLM-Apps der einzige Weg zu privatem, offlinenem KI auf Xperia-Geräten.

Das Xperia 1 VI ist das einzige Xperia, das quantisierte 7B+-Modelle ausführen kann. Sein Snapdragon 8 Gen 3 SoC und 12 GB LPDDR5X RAM geben ihm Spielraum für Phi-4 Q4 (14B quantisiert auf ~8 GB) und Qwen2.5-3B neben dem normalen App-Betrieb. Das Xperia 5 V mit Snapdragon 8 Gen 2 und 8 GB RAM ist der Sweet Spot für 3B-Modelle — Rinna 3.6B und Gemma 2B Q4 laufen zuverlässig. Das Xperia 10 VI verwendet den Mid-Range Snapdragon 6 Gen 1 mit nur 6 GB RAM; auf dieser Stufe bei TinyLlama 1.1B oder Gemma 2B bleiben — größere Modelle werden beim Laden abstürzen oder OOM-Fehler verursachen.

Xperia 1 VI für 7B+-Modelle verwenden; Xperia 5 V für 3B-Modelle; auf dem Xperia 10 VI bei Sub-2B-Modellen bleiben.

Anleitungen zur App-Einrichtung finden Sie in unserem Android-LLM-Apps für Japan Guide.

Xperia-ModellRAM / ChipEmpfohlene Modelle
Xperia 1 VI12 GB / Snapdragon 8 Gen 3Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B
Xperia 5 V8 GB / Snapdragon 8 Gen 2Rinna 3.6B, Gemma 2B Q4
Xperia 10 VI6 GB / Snapdragon 6 Gen 1TinyLlama 1.1B, Gemma 2B nur

Einrichtung in 3 Schritten

Die Installation eines lokalen LLM auf einem Xperia dauert drei Schritte und unter 30 Minuten einschließlich Modell-Download-Zeit. Der Prozess erfordert keinen Root-Zugang, keinen Entwicklermodus und keine speziellen Xperia-Einstellungen — er läuft vollständig über Standard-Android-App- und Dateiverwaltung.

Schritt 1: MLC Chat oder PocketPal AI aus dem Google Play Store installieren. Beide sind kostenlos und in Japan ohne VPN oder Region-Umgehung verfügbar. MLC Chat ist schneller bis zur ersten Inferenz; PocketPal AI unterstützt eine breitere Palette von GGUF-Modelldateien von Hugging Face.

Schritt 2: Modell über WLAN herunterladen. TinyLlama 1.1B Q4 ist ca. 0,7 GB, Rinna 3.6B Q4 ca. 2 GB, Gemma 2B Q4 ca. 1,5 GB und Phi-4 Q4 ca. 8 GB. Für Phi-4 ein Xperia mit 128 GB oder mehr Speicher verwenden. Vor dem Start von Phi-4 Q4 alle anderen Apps schließen — es benötigt ca. 8 GB des verfügbaren 12 GB RAMs und braucht maximalen Arbeitsspeicher zum Laden. Download über mobile Daten vermeiden.

Schritt 3: Tastatur auf japanische Eingabe umstellen. Gboard mit aktiviertem Japanisch oder ATOK funktionieren beide direkt mit MLC Chat und PocketPal AI — man tippt auf Japanisch, das Modell antwortet auf Japanisch. Keine zusätzliche Konfiguration für japanische Spracheingabe erforderlich.

Akkuhinweis: Beim Xperia 1 VI ist mit ca. 15 % Akkuverbrauch pro Stunde bei aktiviertem Display und kontinuierlicher Inferenz zu rechnen. Flugmodus aktivieren reduziert den Hintergrundradio-Verbrauch. Sony Xperia AI Agent (aktuell in der Beta) verbindet sich mit Cloud-KI-Diensten — für vollständige On-Device-Verarbeitung ohne Datenweitergabe ist MLC Chat der einzige Weg. Vollständige Anleitung: KI auf Tablets und Android-Geräten ausführen.

Schnelle Antworten zu Xperia-LLMs

Funktioniert ein lokales LLM auf dem Xperia 10 VI?
Nur TinyLlama 1.1B und Gemma 2B Q4. Das Xperia 10 VI hat 6 GB RAM und einen Snapdragon 6 Gen 1 — größere Modelle stürzen ab oder erzeugen Out-of-Memory-Fehler beim Laden. Rinna 3.6B oder 7B-Modelle auf dem Xperia 10 VI nicht versuchen.
Wie viel Speicherplatz benötigt ein Modell auf dem Xperia?
Rinna 3.6B Q4 benötigt ca. 2 GB Speicher. Phi-4 Q4 ca. 8 GB. TinyLlama 1.1B Q4 ca. 0,7 GB. Für Phi-4 ein Xperia mit 128 GB oder mehr verwenden; 64 GB Speicher reichen für Rinna 3.6B und Gemma 2B.
Wie viel Akku verbraucht ein LLM auf dem Xperia?
Etwa 15 % Akku pro Stunde bei aktiviertem Bildschirm und kontinuierlicher Inferenz auf dem Xperia 1 VI bei voller Leistung. Auf dem Xperia 5 V mit Rinna 3.6B ähnlicher Verbrauch zu erwarten. Flugmodus aktivieren reduziert den Hintergrundradio-Verbrauch um 2–4 % pro Stunde.
Funktioniert es offline auf dem Xperia?
Ja — vollständig offline nach dem ersten Modell-Download. MLC Chat und PocketPal AI benötigen weder Internetverbindung, noch API-Schlüssel, noch ein Sony-Konto, sobald das Modell auf dem Gerät gespeichert ist. Während der Inferenz verlässt kein Datum das Gerät.
Was ist der Unterschied zwischen Sony Xperia AI Agent und einem lokalen LLM?
Sony Xperia AI Agent (Beta) leitet Anfragen über Cloud-KI-Server weiter — Ihre Prompts und Antworten passieren Sonys oder die Infrastruktur eines Drittanbieters. Ein lokales LLM über MLC Chat wird vollständig auf dem Snapdragon-Chip des Xperia ausgeführt — Daten verlassen das Gerät nie. Dieser On-Device-Ansatz ist die datenschutzkonforme Alternative für Nutzer, die sensible Daten gemäß DSGVO verarbeiten.