Points clés
- Apple Intelligence est un hybride à trois niveaux — AFM Core on-device (Apple pur, zéro Google), Private Cloud Compute (serveurs Apple) et AFM 3 Cloud Pro (GPU Nvidia dans Google Cloud, affiné avec Gemini).
- Le modèle on-device de votre iPhone est du pur Apple — AFM Core / AFM 3 Core Advanced, 20B sparse, active 1–4B paramètres par invite via Instruction-Following Pruning.
- Gemini est un signal d'entraînement, pas le runtime — le modèle cloud d'Apple a été affiné avec des sorties Gemini ; Gemini ne tourne pas sur votre appareil.
- Les LLM locaux auto-hébergés offrent un contrôle qu'Apple ne peut égaler — poids ouverts, quantification libre, outils au choix, hors ligne total, modèles échangeables.
- WWDC 2026 (8 juin, dernier keynote de Tim Cook) : six OS en bêta, app Siri dédiée avec historique iCloud, aperçu homeOS pour HomePad.
- EU/RGPD : on-device = résidence des données par défaut ; Cloud Pro transite par Google Cloud (États-Unis) — questions de transfert Chapitre V applicables.
Ce qu'Apple a annoncé à WWDC 2026
La WWDC 2026 s'est ouverte le 8 juin avec le dernier keynote de Tim Cook en tant que CEO. La grande annonce : une stratégie IA entièrement repensée — une nouvelle app Siri dédiée avec historique de conversation synchronisé via iCloud, six OS en bêta (iOS 27, iPadOS 27, macOS 27, watchOS 27, tvOS 27, visionOS 27 — lancement complet prévu à l'automne 2026) et un aperçu homeOS pour développeurs lié au futur hub smart home HomePad.
La couche IA s'appelle Apple Intelligence, désormais co-développée avec Google en utilisant la technologie Gemini. Les modèles on-device (AFM Core / AFM 3 Core Advanced) sont signés Apple. Le modèle cloud (AFM 3 Cloud Pro) a été affiné avec des sorties Gemini et tourne sur des GPU Nvidia dans Google Cloud.
📍 En une phrase
À la WWDC 2026, Apple a présenté Apple Intelligence comme un hybride à trois niveaux : modèles AFM on-device (Apple pur), Private Cloud Compute (serveurs Apple) et AFM 3 Cloud Pro sur GPU Nvidia dans Google Cloud (affiné avec Gemini).
💬 En termes simples
Apple Intelligence est le système IA d'Apple. Les tâches simples (dictée, réponses rapides) s'exécutent entièrement sur la puce de votre iPhone et ne quittent jamais votre appareil. Les tâches plus lourdes peuvent aller sur des serveurs cloud Apple. Les tâches de raisonnement les plus complexes vont sur un serveur Google Cloud faisant tourner un modèle Apple entraîné en partie avec Gemini.
L'architecture à trois niveaux : ce qui tourne où
Apple Intelligence oriente chaque tâche vers l'un des trois niveaux selon sa complexité. Le niveau atteint détermine la garantie de confidentialité.
| Tier | Where it runs | What it handles | Touches Google? |
|---|---|---|---|
| On-device | Puce Apple Silicon (AFM Core / AFM 3 Core Advanced) | Dictée, conscience écran, recherches de contexte personnel, tâches rapides | Non — Apple pur. Zéro code Google, Gemini ou Search |
| Private Cloud Compute (PCC) | Serveurs Apple Silicon (attestés, audités) | Tâches intermédiaires nécessitant plus de puissance que l'appareil | Non — aucun accès tiers aux données |
| Cloud Pro | GPU Nvidia dans Google Cloud (AFM 3 Cloud Pro) | Tâches de connaissance du monde les plus lourdes et raisonnement complexe | Oui — infrastructure Google Cloud ; modèle affiné avec sorties Gemini |
Gemini est un enseignant, pas le modèle en production
L'aspect le plus mal compris de WWDC 2026 est la relation avec Google. Apple distingue soigneusement « entraîné avec Gemini » et « est Gemini ». Les modèles on-device — AFM Core et AFM 3 Core Advanced — sont d'Apple et n'ont aucun lien avec Google. Vos interactions on-device ne parviennent jamais à Google.
Le modèle cloud (AFM 3 Cloud Pro) est différent. Il tourne sur des GPU Nvidia dans Google Cloud. Apple indique que le modèle a été affiné à l'aide de sorties Gemini — un processus de distillation de connaissances où les sorties de Gemini ont servi de signal d'entraînement. Le résultat est le modèle d'Apple, mais hébergé sur l'infrastructure Google.
Rapporté (non confirmé) : le partenariat vaudrait environ 1 Md$/an ; le modèle cloud aurait environ 1,2T paramètres. Apple aurait d'abord tenté d'utiliser son propre matériel PCC pour les tâches lourdes, mais l'aurait jugé trop lent, conduisant à l'accord Google Cloud.
📍 En une phrase
Gemini a entraîné l'AFM 3 Cloud Pro d'Apple via distillation de connaissances ; les modèles on-device n'ont aucun lien avec Google et les interactions iPhone ne parviennent jamais à Google.
Le modèle on-device d'Apple vs un LLM local auto-hébergé
Le modèle on-device d'Apple et un LLM open-weight auto-hébergé traitent tous deux en local — mais les différences sont importantes :
| Apple AFM 3 Core Advanced (on-device) | Self-hosted local LLM (Qwen / Llama / Gemma) | |
|---|---|---|
| Taille du modèle | 20B sparse ; active 1–4B paramètres/invite (Instruction-Following Pruning) | Votre choix : 3B–70B+ |
| Contrôle | Verrouillé sur OS Apple ; non échangeable | Total : modèle, quantification et outils au choix |
| Mode hors ligne | Niveau on-device hors ligne ; tâches lourdes vers le cloud | Entièrement hors ligne si vous le souhaitez |
| Confidentialité | Forte pour le niveau on-device ; les niveaux cloud traitent votre requête | Absolue — rien ne quitte votre machine |
| Ouverture | Poids fermés ; écosystème Apple uniquement | Poids ouverts ; inspectables et ajustables |
| Mise à jour / changement de modèle | Apple contrôle le calendrier de sortie | Vous choisissez quand mettre à jour ou changer |
Ce que ça signifie pour les utilisateurs : vie privée en pratique
La question pratique : mes données restent-elles sur l'appareil ? La réponse dépend entièrement du niveau qui traite la tâche. Apple offre une certaine transparence, mais vous ne pouvez pas observer directement quel niveau est déclenché pour une requête donnée.
| What you ask | Which tier? | Leaves device? | Touches Google Cloud? |
|---|---|---|---|
| Dictée, minuterie, réponse rapide | On-device | Non | Non |
| Résumer un long fil e-mail | PCC ou Cloud Pro | Oui | Possible (Cloud Pro) |
| Recherche complexe ou rédaction créative | Cloud Pro | Oui | Oui |
| LLM auto-hébergé via Ollama | Votre machine | Jamais | Jamais |
Gardez notes médicales, documents juridiques et données d'entreprise confidentielles hors d'Apple Intelligence si vous ne pouvez garantir le niveau on-device. Pour une résidence des données vérifiée, les LLM locaux auto-hébergés restent la seule option confirmée.
Ce que ça signifie pour les développeurs et les entreprises
L'enjeu développeur de WWDC 2026 porte moins sur la qualité du modèle que sur la surface d'action. Apple étend App Intents pour qu'Apple Intelligence puisse appeler des apps tierces — mais uniquement via des actions et structures de données explicitement déclarées. Siri ne scrape pas l'interface ; elle appelle des intents déclarés.
C'est fonctionnellement analogue au GEO (Generative Engine Optimization). Au lieu de structurer du contenu pour des crawlers IA, vous structurez la surface d'action que votre app expose au modèle OS. Les apps avec des App Intents clairs et granulaires apparaîtront dans les résultats Apple Intelligence ; les autres, non.
Pour les entreprises UE/RGPD : le niveau on-device fournit une résidence des données par défaut, pouvant satisfaire l'Art. 32 RGPD pour les tâches simples. Le niveau Cloud Pro transite par Google Cloud aux États-Unis, soulevant les mêmes questions de transfert Chapitre V que tout autre service cloud américain.
Le verdict honnête
Apple vient de faire de l'IA privée on-device une attente grand public pour environ un milliard d'utilisateurs — cette validation de l'approche local-first compte. Mais Apple Intelligence est un système hybride, partiellement soutenu par Google, à poids fermés : une porte d'entrée vers l'état d'esprit local-AI, pas un remplacement pour héberger ses propres modèles.
Si la confidentialité est votre motivation principale, l'architecture à trois niveaux introduit de vraies réserves : les niveaux cloud traitent vos requêtes, le niveau Cloud Pro tourne sur l'infrastructure Google Cloud aux États-Unis, et vous ne contrôlez ni les poids, ni la logique de routage, ni le calendrier de mise à jour.
Les LLM locaux auto-hébergés — Qwen, Llama, Gemma sur votre propre matériel — restent la seule architecture où vous pouvez vérifier que rien ne quitte votre environnement.
Pour les utilisateurs UE : l'on-device offre la résidence des données pour les tâches simples. Pour les tâches complexes routées vers Google Cloud, la même analyse RGPD Chapitre V s'applique que pour tout autre service cloud américain.
Questions fréquentes
Apple Intelligence est-il un LLM local ?
Pas exactement. Apple Intelligence est un hybride à trois niveaux. Les tâches simples utilisent le modèle on-device (AFM Core / AFM 3 Core Advanced), qui tourne sur Apple Silicon et ne quitte jamais l'appareil. Les tâches intermédiaires vont sur les serveurs Private Cloud Compute d'Apple. Les tâches complexes vont sur AFM 3 Cloud Pro, sur GPU Nvidia dans Google Cloud. Seul le premier niveau qualifie de vrai modèle local.
Apple utilise-t-il Gemini sur mon iPhone ?
Non. Les modèles on-device — AFM Core et AFM 3 Core Advanced — sont d'Apple et n'ont aucun lien avec Google. Gemini a servi de signal d'entraînement pour le modèle cloud (AFM 3 Cloud Pro), mais Gemini ne tourne pas sur votre appareil. Vos interactions Apple Intelligence on-device ne parviennent pas à Google.
Mes données sont-elles envoyées à Google ?
Uniquement pour les tâches routées vers le niveau Cloud Pro (AFM 3 Cloud Pro), sur GPU Nvidia dans Google Cloud. Les tâches on-device simples ne quittent jamais votre appareil. Les tâches intermédiaires vont sur Private Cloud Compute Apple (pas Google). Les tâches de raisonnement complexe passent par l'infrastructure Google Cloud.
Quelle est la taille du modèle on-device d'Apple ?
L'AFM 3 Core Advanced d'Apple est un modèle sparse de 20B paramètres qui n'active que 1–4B paramètres par invite via Instruction-Following Pruning, le rendant suffisamment efficace en mémoire pour tourner sur les puces iPhone et Mac.
Puis-je faire tourner mon propre LLM local à la place d'Apple Intelligence ?
Oui. Ollama (gratuit, multiplateforme) permet de faire tourner des modèles open-weight — Qwen, Llama, Gemma — entièrement sur votre propre matériel. Contrairement à Apple Intelligence, les LLM auto-hébergés sont entièrement hors ligne, utilisent des poids ouverts et ne transitent pas par l'infrastructure Apple ou Google.
Apple Intelligence est-il suffisamment privé pour le RGPD ?
Le niveau on-device offre une résidence forte des données — les données ne quittent jamais la puce Apple Silicon, pouvant satisfaire l'Art. 32 RGPD pour les tâches simples. Le niveau Cloud Pro transite par Google Cloud (États-Unis), soulevant des questions de transfert RGPD Chapitre V. Les entreprises UE traitant des données personnelles sensibles devraient réaliser une AIPD.
Siri fonctionne-t-il hors ligne après WWDC 2026 ?
Pour les tâches on-device — dictée, réponses rapides, conscience écran — oui, Siri fonctionne sans connexion. Les tâches nécessitant Private Cloud Compute ou Cloud Pro requièrent une connexion.
Qu'est-ce que homeOS et le HomePad ?
homeOS est un nouveau système d'exploitation présenté à WWDC 2026 pour les hubs smart home. Apple a montré un aperçu développeur lié au futur HomePad. Les specs et la date de sortie du HomePad n'ont pas été annoncés.