XperiaでローカルLLMを動かせる?
クイック回答
はい — Xperia 1 VI(12 GB RAM、Snapdragon 8 Gen 3)はMLC Chat経由でRinna 3.6BとPhi-4 Q4を実行できます。Xperia 5 V(8 GB)は軽量モデルに対応。Xperia 10 VI(6 GB)はTinyLlamaとGemma 2Bのみ動作します。
- ▸Xperia 1 VI:12 GB RAM — Phi-4 Q4、Rinna 3.6B、Qwen2.5-3Bが動作
- ▸Xperia 5 V:8 GB RAM — Rinna 3.6BとGemma 2B Q4に対応
- ▸Xperia 10 VI:6 GB RAM — TinyLlamaとGemma 2Bのみ
- ▸SonyはGalaxy AIのような機能を搭載していない — MLC Chat経由のローカルLLMがその代替となる
更新: 2026-05
重要なポイント
- ✓Xperia 1 VI(12 GB RAM、Snapdragon 8 Gen 3)は7B+モデルを確実に動かせる唯一のXperia — Phi-4 Q4とQwen2.5-3Bに最適
- ✓Xperia 5 V(8 GB RAM)はRinna 3.6BやGemma 2B Q4を含む3Bモデルを問題なく処理できる
- ✓Xperia 10 VI(6 GB RAM)はSub-2Bモデルに限定 — TinyLlama 1.1BとGemma 2Bが実用上の上限
- ✓SonyはOn-Device AI機能を提供していない — Google PlayストアのMLC ChatまたはPocketPal AIが実用的な代替となる
- ✓Xperia 1 VIでの画面点灯・連続推論時のバッテリー消耗は約15%/時間;機内モードで消耗を軽減できる
Xperiaモデル別の対応状況
2026年5月時点で、現行の3つのXperiaモデルがローカルLLM推論に対応しており、性能はRAMとチップセットによって完全に決まります — Xperia 1 VIがトップ、Xperia 5 Vがミドルレンジをカバー、Xperia 10 VIは最小モデルに限定されます。 Sonyは(Samsung Galaxy AIとは異なり)On-Device AIアシスタントを事前インストールしていないため、ローカルLLMアプリがXperiaデバイスでプライベートなオフラインAIを実現する唯一の手段です。国産ブランドのSonyが作るXperiaで、外部サーバーに依存せず日本語AIを動かせるのは、秋葉原のガジェット愛好家から企業ユーザーまで注目を集めています。
Xperia 1 VIは、量子化された7B+モデルを実行できる唯一のXperiaです。Snapdragon 8 Gen 3 SoCと12 GB LPDDR5X RAMにより、通常のアプリ使用に加えてPhi-4 Q4(14Bを約8 GBに量子化)やQwen2.5-3Bを動かす余裕があります。Snapdragon 8 Gen 2と8 GB RAMを搭載したXperia 5 Vは3Bモデルのスイートスポット — Rinna 3.6BとGemma 2B Q4が安定して動作します。Xperia 10 VIはミッドレンジのSnapdragon 6 Gen 1と6 GB RAMのみ;このクラスではTinyLlama 1.1BまたはGemma 2Bにとどめること — 大きなモデルはロード中にクラッシュするかOOMエラーになります。
Xperia 1 VIは7B+モデル、Xperia 5 Vは3Bモデル、Xperia 10 VIはSub-2Bモデルに使用してください。
アプリの設定手順については、日本向けAndroid LLMアプリガイドをご覧ください。
| Xperiaモデル | RAM / チップ | 推奨モデル |
|---|---|---|
| Xperia 1 VI | 12 GB / Snapdragon 8 Gen 3 | Phi-4 Q4、Rinna 3.6B、Qwen2.5-3B |
| Xperia 5 V | 8 GB / Snapdragon 8 Gen 2 | Rinna 3.6B、Gemma 2B Q4 |
| Xperia 10 VI | 6 GB / Snapdragon 6 Gen 1 | TinyLlama 1.1B、Gemma 2Bのみ |
3ステップ導入ガイド
XperiaへのローカルLLMインストールは3ステップで、モデルダウンロード時間を含めて30分未満で完了します。 ルートアクセス、開発者モード、特別なXperia設定は不要 — 標準のAndroidアプリ管理とファイル管理のみで完結します。
ステップ1:Google PlayストアからMLC ChatまたはPocketPal AIをインストールします。両アプリとも無料で、VPNや地域回避なしで日本のPlayストアから入手できます。MLC Chatは最初の推論までが速く、PocketPal AIはHugging FaceからのGGUFモデルファイルを幅広くサポートしています。
ステップ2:Wi-Fiでモデルをダウンロードします。モデルサイズの目安:TinyLlama 1.1B Q4は約0.7 GB、Rinna 3.6B Q4は約2 GB、Gemma 2B Q4は約1.5 GB、Phi-4 Q4は約8 GBです。Phi-4には128 GB以上のストレージを持つXperiaが必要です。Phi-4 Q4を起動する前にすべての他のアプリを閉じてください — 利用可能な12 GB RAMのうち約8 GBを使用するため、クラッシュなしにロードするには最大のメモリ空きが必要です。モバイルデータでのダウンロードは避けてください。
ステップ3:キーボードを日本語入力に切り替えます。Gboard(日本語設定済み)またはATOK(日本のビジネスユーザーに人気)はいずれもMLC ChatとPocketPal AIで直接動作します — 日本語で入力するとモデルも日本語で応答します。日本語入力のための追加設定は不要です。
バッテリーについて:Xperia 1 VIでの画面点灯・連続推論時は約15%/時間のバッテリー消耗を想定してください。機内モード(機内モード)を有効にするとバックグラウンドの無線通信による消耗を抑えられます。省電力モードはさらに消耗を抑えますが、SnapdragonのAIコアをスロットリングして推論速度が低下する場合があります。Sony Xperia AIエージェント(ベータ版)はクラウドAIサービスに接続します — MLC Chat経由のローカルLLMは個人情報保護法(APPI)に基づいてデータを外部送信せずにAIを使う唯一の手段です。Androidタブレット・スマートフォンでのAI実行に関する完全ガイドはタブレット・AndroidでAIを動かすをご参照ください。