Meilleures applications LLM locales pour Android ?

Lire en:

🇺🇸en 🇩🇪de 🇫🇷fr 🇯🇵ja 🇨🇳zh 🇪🇸es 🇧🇷pt 🇸🇦ar 🇰🇷ko

Réponse rapide

Les meilleures applications Android pour exécuter des LLMs localement sont MLC Chat, Pocketpal et Termux avec Ollama. MLC Chat est la plus facile pour les débutants. Toutes fonctionnent entièrement hors ligne.

▸MLC Chat : configuration la plus simple, modèles préoptimisés pour Android
▸Pocketpal : chargement de modèles GGUF flexible
▸Termux + Ollama : Ollama complet sur Android, nécessite 8+ Go de RAM

Mis à jour : 2026-05

Tool Comparisons

Points clés

✓MLC Chat est le point de départ le plus facile pour les LLMs Android — installez depuis Google Play, choisissez un modèle, utilisez hors ligne immédiatement
✓Pocketpal prend en charge le chargement de tout fichier GGUF depuis Hugging Face, offrant aux utilisateurs avancés une flexibilité totale de modèles sur Android
✓Termux + Ollama apporte le CLI Ollama complet sur Android, mais nécessite un appareil avec 8+ Go de RAM et une aisance avec le terminal
✓Android nécessite 8 Go de RAM pour les modèles 7B et au moins 4 Go de RAM pour les modèles 2–4B ; vérifiez les specs avant d'installer

Les trois options qui fonctionnent

Besoin de la comparaison technique complète ? Benchmarks NPU sur des téléphones réels et 6 apps Android comparées : guide technique Android LLM approfondi. Cette page donne la réponse rapide "quelle app installer".

En mai 2026, il existe trois méthodes pratiques pour exécuter un LLM local sur Android : MLC Chat (Machine Learning Compilation), Pocketpal AI et Termux avec Ollama. Les trois fonctionnent 100 % hors ligne après le téléchargement initial du modèle — aucune clé API ni connexion internet requise.

MLC Chat utilise le framework de compilation MLC-LLM pour préoptimiser les poids des modèles pour le matériel mobile. Vous le téléchargez depuis Google Play, sélectionnez un modèle pris en charge (Llama 3, Gemma, Phi), et le modèle se télécharge et s'exécute directement sur l'appareil. La configuration prend moins de 10 minutes.

Pocketpal AI est développée par la communauté Hugging Face et prend en charge le chargement de fichiers GGUF directement depuis Hugging Face. Cela signifie que vous pouvez exécuter n'importe quel modèle compatible GGUF, pas seulement une liste prédéfinie. La contrepartie est une configuration légèrement plus complexe nécessitant une sélection et un téléchargement manuel du modèle.

Application	Effort de configuration	Flexibilité des modèles
MLC Chat	Facile (Play Store)	Modèles préoptimisés uniquement
Pocketpal	Moyen	GGUF from Hugging Face
Termux + Ollama	Avancé (CLI)	Bibliothèque Ollama complète

Quelle application installer en premier

Commencez par MLC Chat si c'est votre premier setup LLM Android — c'est le plus rapide jusqu'au premier token et le moins de configuration. Pocketpal est la voie d'évolution pour les utilisateurs qui veulent changer de modèles fréquemment. Termux + Ollama est destiné aux développeurs qui connaissent déjà Ollama et veulent le même workflow CLI sur mobile.

Un téléphone Android haut de gamme avec 8+ Go de RAM gère un modèle 2–3B à 4–8 tok/s sur CPU. Les téléphones milieu de gamme de 2023–2024 sont plus lents (1–3 tok/s) — utilisables pour les tâches en lot, frustrants pour le chat en direct. N'essayez pas les modèles 7B sur un appareil avec moins de 8 Go de RAM.

Termux + Ollama est l'option la plus puissante mais présente la courbe de configuration la plus abrupte. Vous installez Termux depuis F-Droid, puis exécutez pkg install ollama dans le terminal. Une fois installé, toutes les commandes Ollama standard fonctionnent, y compris ollama pull et ollama run. Cette approche convient mieux aux développeurs qui utilisent déjà Ollama sur desktop.

La consommation de batterie est importante à partir du niveau 7B. Une session de chat de 30 minutes avec Llama 3 8B Q4 sur un téléphone haut de gamme utilise en moyenne 8–12 % de batterie. Pour une utilisation fréquente, branchez l'appareil ou restez sur des modèles 2–3B comme Phi-3 Mini et Gemma 2B qui consomment moins.

Benchmarks techniques, données NPU sur matériel Android réel et compromis de quantisation : guide technique Android LLM approfondi.

Pour des options d'applications spécifiques au Japon avec les appareils Xperia et AQUOS, consultez notre guide des meilleures apps LLM Android pour le Japon.

Réponses rapides sur les applications LLM Android

MLC Chat fonctionne-t-il sur tous les téléphones Android ?▾

MLC Chat nécessite Android 10 ou version ultérieure et au moins 4 Go de RAM. Pour les modèles 7B, 8 Go de RAM sont recommandés. L'application est disponible sur Google Play et prend en charge les familles de modèles Llama, Gemma et Phi.

Puis-je utiliser Pocketpal AI sans compte Hugging Face ?▾

Oui. Pocketpal AI peut télécharger des modèles GGUF depuis des dépôts Hugging Face publics sans compte. Un compte Hugging Face n'est nécessaire que pour les dépôts de modèles privés ou à accès restreint.

Comment installer Ollama sur Android via Termux ?▾

Installez Termux depuis F-Droid (pas Google Play — la version du Play Store est obsolète). Dans Termux, exécutez pkg update && pkg install ollama. Utilisez ensuite les commandes Ollama standard : ollama pull llama3 et ollama run llama3. Votre appareil nécessite 8+ Go de RAM pour un fonctionnement fiable.

Quelle application LLM Android est la meilleure pour les débutants ?▾

MLC Chat est le meilleur point de départ. Elle s'installe depuis Google Play en moins d'une minute, propose une liste organisée de modèles préoptimisés et ne nécessite aucune expérience en ligne de commande. Consultez le guide des meilleurs frontends Ollama pour des options si vous souhaitez une interface de chat plus riche.

← Retour aux Prompts en bref