¿Puedes ejecutar un LLM local en un teléfono Xperia?
Respuesta rápida
Sí — el Xperia 1 VI (12 GB RAM, Snapdragon 8 Gen 3) ejecuta Rinna 3.6B y Phi-4 Q4 a través de MLC Chat. El Xperia 5 V (8 GB) maneja modelos ligeros. El Xperia 10 VI (6 GB) está limitado a TinyLlama y Gemma 2B.
- ▸Xperia 1 VI: 12 GB RAM — ejecuta Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B
- ▸Xperia 5 V: 8 GB RAM — ejecuta Rinna 3.6B y Gemma 2B Q4
- ▸Xperia 10 VI: 6 GB RAM — solo TinyLlama y Gemma 2B
- ▸Sony no incluye funciones similares a Galaxy AI — un LLM local a través de MLC Chat cubre esa brecha
Actualizado: 2026-05
Puntos clave
- ✓El Xperia 1 VI (12 GB RAM, Snapdragon 8 Gen 3) es el único Xperia que ejecuta modelos 7B+ de forma fiable — ideal para Phi-4 Q4 y Qwen2.5-3B
- ✓El Xperia 5 V (8 GB RAM) maneja modelos 3B como Rinna 3.6B y Gemma 2B Q4 sin problemas
- ✓El Xperia 10 VI (6 GB RAM) está limitado a modelos sub-2B — TinyLlama 1.1B y Gemma 2B son el techo práctico
- ✓Sony no incluye funciones de IA On-Device — MLC Chat o PocketPal AI de Google Play es el reemplazo práctico
- ✓El consumo de batería es aproximadamente un 15% por hora con pantalla encendida durante inferencia continua en el Xperia 1 VI; usa el modo avión para reducir el consumo
Compatibilidad por modelo Xperia
A partir de mayo de 2026, tres modelos actuales de Xperia admiten inferencia LLM local, con capacidad determinada enteramente por la RAM y el chipset — el Xperia 1 VI lidera, el Xperia 5 V cubre el rango medio y el Xperia 10 VI está limitado a los modelos más pequeños. Sony no preinstala asistentes de IA On-Device (a diferencia de Samsung Galaxy AI), por lo que las aplicaciones LLM locales son la única vía hacia una IA privada y sin conexión en dispositivos Xperia.
El Xperia 1 VI es el único Xperia capaz de ejecutar modelos 7B+ cuantizados. Su SoC Snapdragon 8 Gen 3 y sus 12 GB de RAM LPDDR5X le dan margen para Phi-4 Q4 (14B cuantizado a ~8 GB) y Qwen2.5-3B junto con el uso habitual de aplicaciones. El Xperia 5 V con Snapdragon 8 Gen 2 y 8 GB RAM es el punto óptimo para modelos 3B — Rinna 3.6B y Gemma 2B Q4 funcionan de forma fiable. El Xperia 10 VI utiliza el Snapdragon 6 Gen 1 de gama media con solo 6 GB RAM; en este nivel, quédate con TinyLlama 1.1B o Gemma 2B — los modelos más grandes se bloquearán o producirán errores de memoria durante la carga.
Usa el Xperia 1 VI para modelos 7B+; el Xperia 5 V para modelos 3B; quédate con modelos sub-2B en el Xperia 10 VI.
Para instrucciones de configuración de aplicaciones, consulta nuestra guía de aplicaciones LLM para Android en Japón.
| Modelo Xperia | RAM / Chip | Modelos recomendados |
|---|---|---|
| Xperia 1 VI | 12 GB / Snapdragon 8 Gen 3 | Phi-4 Q4, Rinna 3.6B, Qwen2.5-3B |
| Xperia 5 V | 8 GB / Snapdragon 8 Gen 2 | Rinna 3.6B, Gemma 2B Q4 |
| Xperia 10 VI | 6 GB / Snapdragon 6 Gen 1 | TinyLlama 1.1B, solo Gemma 2B |
Guía de configuración en 3 pasos
Instalar un LLM local en un Xperia lleva tres pasos y menos de 30 minutos, incluido el tiempo de descarga del modelo. El proceso no requiere acceso root, modo desarrollador ni configuraciones especiales de Xperia — funciona completamente a través de la gestión estándar de aplicaciones y archivos de Android.
Paso 1: Instala MLC Chat o PocketPal AI desde Google Play (Google Playストア). Ambas son gratuitas y están disponibles en Japón sin VPN ni acceso alternativo por región. MLC Chat es más rápido hasta la primera inferencia; PocketPal AI admite una gama más amplia de archivos de modelos GGUF desde Hugging Face.
Paso 2: Descarga tu modelo por Wi-Fi. Los tamaños de descarga varían: TinyLlama 1.1B Q4 pesa aproximadamente 0,7 GB, Rinna 3.6B Q4 aproximadamente 2 GB, Gemma 2B Q4 aproximadamente 1,5 GB y Phi-4 Q4 aproximadamente 8 GB. Usa un Xperia con 128 GB de almacenamiento o más para Phi-4. Cierra todas las demás aplicaciones antes de cargar Phi-4 Q4 — usa aproximadamente 8 GB de los 12 GB RAM disponibles en el Xperia 1 VI y necesita la máxima memoria disponible para cargar sin bloquearse. No descargues con datos móviles — los archivos son grandes.
Paso 3: Cambia el teclado a entrada en japonés. Gboard con japonés habilitado o ATOK (popular en Japón para uso empresarial) funcionan directamente con MLC Chat y PocketPal AI — escribes en japonés, el modelo responde en japonés. No se requiere configuración adicional para que funcione la entrada en japonés.
Nota sobre la batería: espera aproximadamente un 15% de consumo de batería por hora con pantalla encendida durante la inferencia continua en el Xperia 1 VI. Activa el modo avión (機内モード) durante las sesiones de inferencia para reducir el consumo de radio en segundo plano y ampliar el tiempo de sesión. El modo de ahorro de energía reduce más el consumo, pero puede limitar los núcleos de IA del Snapdragon y reducir la velocidad de inferencia. Sony Xperia AI Agent (actualmente en beta) se conecta a servicios de IA en la nube — un LLM local a través de MLC Chat es la única forma de ejecutar inferencia de IA completamente en el Xperia sin enviar datos a servidores externos, una distinción importante para la privacidad. Para una guía completa de configuración de LLM en Android, consulta ejecutar IA en tabletas y teléfonos Android.