Skip to main content
PromptQuorumPromptQuorum

Xperia手机能运行本地LLM吗?

快速回答

可以——Xperia 1 VI(12 GB内存,Snapdragon 8 Gen 3)可通过MLC Chat运行Rinna 3.6B和Phi-4 Q4。Xperia 5 V(8 GB)支持轻量模型。Xperia 10 VI(6 GB)仅限TinyLlama和Gemma 2B。

  • Xperia 1 VI:12 GB内存——可运行Phi-4 Q4、Rinna 3.6B、Qwen2.5-3B
  • Xperia 5 V:8 GB内存——可运行Rinna 3.6B和Gemma 2B Q4
  • Xperia 10 VI:6 GB内存——仅限TinyLlama和Gemma 2B
  • Sony不包含Galaxy AI类功能——通过MLC Chat运行本地LLM填补了这一空缺

更新于: 2026-05

Hardware Guides

关键要点

  • Xperia 1 VI(12 GB内存,Snapdragon 8 Gen 3)是唯一能可靠运行7B+模型的Xperia机型——适合Phi-4 Q4和Qwen2.5-3B
  • Xperia 5 V(8 GB内存)可流畅处理3B模型,包括Rinna 3.6B和Gemma 2B Q4
  • Xperia 10 VI(6 GB内存)仅限Sub-2B模型——TinyLlama 1.1B和Gemma 2B是实际上限
  • Sony不提供On-Device AI功能——Google Play上的MLC Chat或PocketPal AI是实用的替代方案
  • Xperia 1 VI屏幕开启持续推理时电池消耗约15%/小时;开启飞行模式可减少消耗

Xperia机型兼容性

截至2026年5月,三款现行Xperia机型支持本地LLM推理,性能完全由内存和芯片组决定——Xperia 1 VI居首,Xperia 5 V覆盖中端,Xperia 10 VI仅限最小模型。 Sony不预装On-Device AI助手(不同于Samsung Galaxy AI),因此本地LLM应用是在Xperia设备上实现私密离线AI的唯一途径。

Xperia 1 VI是唯一能运行量化7B+模型的Xperia机型。其Snapdragon 8 Gen 3 SoC和12 GB LPDDR5X内存在日常应用运行的同时,还能处理Phi-4 Q4(14B量化至约8 GB)和Qwen2.5-3B。搭载Snapdragon 8 Gen 2和8 GB内存的Xperia 5 V是3B模型的最佳选择——Rinna 3.6B和Gemma 2B Q4运行稳定。Xperia 10 VI使用中端Snapdragon 6 Gen 1,内存仅6 GB;此配置下请坚持使用TinyLlama 1.1B或Gemma 2B——更大的模型加载时会崩溃或出现OOM错误。

7B+模型选Xperia 1 VI;3B模型选Xperia 5 V;Xperia 10 VI上坚持使用Sub-2B模型。

应用安装说明,请参阅我们的日本Android LLM应用指南

Xperia机型内存 / 芯片推荐模型
Xperia 1 VI12 GB / Snapdragon 8 Gen 3Phi-4 Q4、Rinna 3.6B、Qwen2.5-3B
Xperia 5 V8 GB / Snapdragon 8 Gen 2Rinna 3.6B、Gemma 2B Q4
Xperia 10 VI6 GB / Snapdragon 6 Gen 1TinyLlama 1.1B、Gemma 2B(仅限)

3步安装指南

在Xperia上安装本地LLM只需三步,包含模型下载时间在内不超过30分钟。 整个过程无需Root权限、无需开发者模式、无需特殊Xperia设置——完全通过标准Android应用和文件管理完成。

第1步:从Google Play(Google Playストア)安装MLC Chat或PocketPal AI。两款应用均免费,在日本无需VPN或地区绕过即可获取。MLC Chat到首次推理速度更快;PocketPal AI支持从Hugging Face加载更广泛的GGUF模型文件。

第2步:通过Wi-Fi下载模型。模型大小参考:TinyLlama 1.1B Q4约0.7 GB,Rinna 3.6B Q4约2 GB,Gemma 2B Q4约1.5 GB,Phi-4 Q4约8 GB。Phi-4建议使用128 GB或更大存储的Xperia。加载Phi-4 Q4前关闭所有其他应用——它需要使用Xperia 1 VI 12 GB内存中的约8 GB,需要最大可用内存才能不崩溃地加载。避免使用移动数据下载——文件较大。

第3步:将键盘切换为日语输入。启用了日语的Gboard或ATOK(在日本商务用户中广受欢迎)均可直接与MLC Chat和PocketPal AI配合使用——用日语输入,模型也用日语回复。日语输入功能无需额外配置。

电池说明:Xperia 1 VI在屏幕开启、全性能持续推理时预计每小时消耗约15%电量。开启飞行模式可减少后台无线通信消耗。Sony Xperia AI助手(目前处于测试阶段)连接云端AI服务——MLC Chat的本地LLM是在不向外部服务器发送数据的情况下使用AI的唯一方式,对于在个人信息保护法(APPI)约束下处理敏感数据的用户尤为重要。完整指南请参阅在平板和Android设备上运行AI

Xperia LLM快速解答

Xperia 10 VI上能运行本地LLM吗?
仅限TinyLlama 1.1B和Gemma 2B Q4。Xperia 10 VI有6 GB内存和Snapdragon 6 Gen 1——更大的模型在加载时会崩溃或产生内存不足错误。不要在Xperia 10 VI上尝试Rinna 3.6B或任何7B模型。
Xperia上运行模型需要多少存储空间?
Rinna 3.6B Q4约需2 GB存储空间。Phi-4 Q4约需8 GB。TinyLlama 1.1B Q4约需0.7 GB。Phi-4建议使用128 GB或更大存储的Xperia;64 GB存储对Rinna 3.6B和Gemma 2B足够。
Xperia运行LLM会消耗多少电量?
Xperia 1 VI在屏幕开启、全性能持续推理时约每小时消耗15%电量。Xperia 5 V运行Rinna 3.6B时消耗相近。开启飞行模式可将后台无线通信消耗降低2至4%/小时。
Xperia上能离线使用吗?
可以——初始模型下载后完全离线运行。MLC Chat和PocketPal AI在模型存储于设备后,既不需要网络连接,也不需要API密钥或Sony账户。推理过程中没有任何数据离开您的手机。
Sony Xperia AI助手与本地LLM有什么区别?
Sony Xperia AI助手(测试版)通过云端AI服务器处理请求——您的提示词和回复会经过Sony或第三方的基础设施。通过MLC Chat运行的本地LLM完全在Xperia的Snapdragon芯片上执行——数据从不离开设备。这种On-Device方式是在个人信息保护法(APPI)约束下处理敏感数据的用户保护隐私的合规替代方案。