Peut-on exécuter un LLM local sur un Xperia ?
Réponse rapide
Oui — le Xperia 1 VI (12 Go de RAM, Snapdragon 8 Gen 3) exécute Rinna 3.6B et Phi-4 Q4 via MLC Chat. Le Xperia 5 V (8 Go) gère les modèles légers. Le Xperia 10 VI (6 Go) est limité à TinyLlama et Gemma 2B.
- ▸Xperia 1 VI : 12 Go de RAM — exécute Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B
- ▸Xperia 5 V : 8 Go de RAM — exécute Rinna 3.6B et Gemma 2B Q4
- ▸Xperia 10 VI : 6 Go de RAM — TinyLlama et Gemma 2B uniquement
- ▸Sony n'inclut pas de fonctionnalités type Galaxy AI — un LLM local via MLC Chat comble ce manque
Mis à jour : 2026-05
Points clés
- ✓Le Xperia 1 VI (12 Go de RAM, Snapdragon 8 Gen 3) est le seul Xperia qui exécute de manière fiable les modèles 7B+ — utilisez-le pour Phi-4 Q4 et Qwen2.5-3B
- ✓Le Xperia 5 V (8 Go de RAM) gère les modèles 3B dont Rinna 3.6B et Gemma 2B Q4 sans problème
- ✓Le Xperia 10 VI (6 Go de RAM) est limité aux modèles sub-2B — TinyLlama 1.1B et Gemma 2B sont le plafond pratique
- ✓Sony ne fournit pas de fonctionnalités IA embarquées — MLC Chat ou PocketPal AI depuis Google Play est le remplacement pratique
- ✓La consommation de batterie est d'environ 15 % par heure écran allumé en inférence continue sur le Xperia 1 VI ; le mode avion réduit la consommation
Compatibilité par modèle Xperia
En mai 2026, trois modèles Xperia actuels prennent en charge l'inférence LLM locale, la capacité étant entièrement déterminée par la RAM et le chipset — le Xperia 1 VI est en tête, le Xperia 5 V couvre le milieu de gamme et le Xperia 10 VI est limité aux plus petits modèles. Sony ne préinstalle pas d'assistants IA embarqués (contrairement à Samsung Galaxy AI), donc les applications LLM locales sont la seule voie vers une IA privée et hors ligne sur les appareils Xperia.
Le Xperia 1 VI est le seul Xperia capable d'exécuter des modèles 7B+ quantifiés. Son SoC Snapdragon 8 Gen 3 et ses 12 Go de RAM LPDDR5X lui donnent de la marge pour Phi-4 Q4 (14B quantifié à ~8 Go) et Qwen2.5-3B en plus de l'utilisation normale des applications. Le Xperia 5 V avec Snapdragon 8 Gen 2 et 8 Go de RAM est le point optimal pour les modèles 3B — Rinna 3.6B et Gemma 2B Q4 fonctionnent de manière fiable. Le Xperia 10 VI utilise le Snapdragon 6 Gen 1 milieu de gamme avec seulement 6 Go de RAM ; à ce niveau, restez sur TinyLlama 1.1B ou Gemma 2B — les modèles plus grands se bloqueront lors du chargement.
Utilisez le Xperia 1 VI pour les modèles 7B+ ; le Xperia 5 V pour les modèles 3B ; restez sur les modèles sub-2B sur le Xperia 10 VI.
Pour les instructions d'installation des applications, consultez notre guide des applications LLM Android pour le Japon.
| Modèle Xperia | RAM / Puce | Modèles recommandés |
|---|---|---|
| Xperia 1 VI | 12 Go / Snapdragon 8 Gen 3 | Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B |
| Xperia 5 V | 8 Go / Snapdragon 8 Gen 2 | Rinna 3.6B, Gemma 2B Q4 |
| Xperia 10 VI | 6 Go / Snapdragon 6 Gen 1 | TinyLlama 1.1B, Gemma 2B uniquement |
Guide d'installation en 3 étapes
L'installation d'un LLM local sur un Xperia prend trois étapes et moins de 30 minutes, temps de téléchargement du modèle inclus. Le processus ne nécessite pas d'accès root, ni de mode développeur, ni de paramètres Xperia spéciaux — il fonctionne entièrement via la gestion standard des applications et des fichiers Android.
Étape 1 : Installer MLC Chat ou PocketPal AI depuis Google Play (Google Playストア). Les deux sont gratuits et disponibles au Japon sans VPN ni contournement de région. MLC Chat est plus rapide jusqu'à la première inférence ; PocketPal AI prend en charge une gamme plus large de fichiers de modèles GGUF depuis Hugging Face.
Étape 2 : Télécharger votre modèle en Wi-Fi. TinyLlama 1.1B Q4 fait environ 0,7 Go, Rinna 3.6B Q4 environ 2 Go, Gemma 2B Q4 environ 1,5 Go et Phi-4 Q4 environ 8 Go. Utilisez un Xperia de 128 Go ou plus pour Phi-4. Fermez toutes les autres applications avant de charger Phi-4 Q4 — il utilise environ 8 Go des 12 Go de RAM disponibles et nécessite le maximum de mémoire pour se charger sans plantage. Évitez le téléchargement via les données mobiles — les fichiers sont volumineux.
Étape 3 : Basculer le clavier en saisie japonaise. Gboard avec le japonais activé ou ATOK (populaire au Japon pour usage professionnel) fonctionnent tous deux directement avec MLC Chat et PocketPal AI — vous tapez en japonais, le modèle répond en japonais. Aucune configuration supplémentaire n'est nécessaire pour la saisie en japonais.
Note batterie : attendez-vous à environ 15 % de consommation par heure écran allumé en inférence continue sur le Xperia 1 VI. Activez le mode avion pour réduire la consommation radio en arrière-plan. Sony Xperia AI Agent (actuellement en bêta) se connecte à des services d'IA cloud — pour un traitement entièrement embarqué sans transmission de données, MLC Chat est la seule solution. Guide complet : exécuter l'IA sur tablettes et appareils Android.