Key Takeaways
- Apple Intelligence é um híbrido de três camadas — AFM Core no dispositivo (Apple puro, zero Google), Private Cloud Compute (servidores Apple) e AFM 3 Cloud Pro (GPUs Nvidia no Google Cloud, refinado com Gemini).
- O modelo no dispositivo do seu iPhone é Apple puro — AFM Core / AFM 3 Core Advanced tem 20B esparso, ativando 1–4B parâmetros por prompt via Instruction-Following Pruning.
- Gemini é um sinal de treinamento, não o runtime — o modelo de nuvem da Apple foi refinado com outputs do Gemini; o Gemini em si não roda no seu dispositivo.
- LLMs locais auto-hospedados oferecem controle que a Apple não pode dar — pesos abertos, quantização livre, qualquer ferramenta, totalmente offline, modelos trocáveis.
- WWDC 2026 (8 de junho, último keynote de Tim Cook como CEO): seis betas de SO, app Siri dedicado com histórico no iCloud, prévia do homeOS para o HomePad.
- UE/LGPD: no dispositivo = residência de dados por padrão; Cloud Pro passa pelo Google Cloud (EUA), levantando questões de transferência do Capítulo V.
O que a Apple anunciou na WWDC 2026
A WWDC 2026 abriu em 8 de junho com o último keynote de Tim Cook como CEO. O destaque foi uma estratégia de IA renovada: um novo app Siri dedicado com histórico de conversas sincronizado via iCloud, seis SO em beta (iOS 27, iPadOS 27, macOS 27, watchOS 27, tvOS 27, visionOS 27 — lançamento completo previsto para o outono de 2026) e uma prévia do homeOS para desenvolvedores ligada ao futuro hub HomePad.
A camada de IA é chamada Apple Intelligence, agora co-desenvolvida com o Google usando tecnologia Gemini. Os modelos no dispositivo (AFM Core / AFM 3 Core Advanced) são da Apple. O modelo de nuvem (AFM 3 Cloud Pro) foi refinado com outputs do Gemini e roda em GPUs Nvidia no Google Cloud.
Na WWDC 2026, a Apple apresentou o Apple Intelligence como um híbrido de três camadas: modelos AFM no dispositivo (Apple puro), Private Cloud Compute (servidores Apple) e AFM 3 Cloud Pro em GPUs Nvidia no Google Cloud (refinado com Gemini).
Apple Intelligence é o sistema de IA no dispositivo da Apple. Tarefas simples (ditado, respostas rápidas) rodam completamente no chip do iPhone e nunca saem do dispositivo. Tarefas mais complexas podem ir para servidores de nuvem da Apple. As tarefas de raciocínio mais complexas vão para um servidor do Google Cloud que executa um modelo da Apple treinado em parte com o Gemini.
A arquitetura de três camadas: o que roda onde
O Apple Intelligence roteia cada tarefa para uma das três camadas conforme a complexidade. Qual camada processa a tarefa determina a garantia de privacidade.
| Tier | Where it runs | What it handles | Touches Google? |
|---|---|---|---|
| No dispositivo | Chip Apple Silicon (AFM Core / AFM 3 Core Advanced) | Ditado, reconhecimento de tela, buscas de contexto pessoal, tarefas rápidas | Não — Apple puro. Zero código Google, Gemini ou Search |
| Private Cloud Compute (PCC) | Servidores Apple Silicon (certificados, auditados) | Tarefas intermediárias que precisam de mais computação | Não — sem acesso de terceiros aos dados |
| Cloud Pro | GPUs Nvidia no Google Cloud (AFM 3 Cloud Pro) | Tarefas mais pesadas de conhecimento do mundo e raciocínio complexo | Sim — infraestrutura Google Cloud; modelo refinado com outputs do Gemini |
Gemini é um professor, não o modelo em produção
A parte mais mal interpretada da WWDC 2026 é a relação com o Google. A Apple distingue cuidadosamente 'treinado com Gemini' de 'é Gemini'. Os modelos no dispositivo — AFM Core e AFM 3 Core Advanced — são da Apple e não têm nenhum envolvimento do Google. Interações no dispositivo nunca chegam ao Google.
O modelo de nuvem (AFM 3 Cloud Pro) é diferente. Ele roda em GPUs Nvidia no Google Cloud. A Apple afirma que o modelo foi refinado usando outputs do Gemini — um processo de destilação de conhecimento onde os outputs do Gemini serviram como sinal de treinamento. O resultado é o próprio modelo da Apple, mas hospedado na infraestrutura do Google.
Reportado (não confirmado): a parceria valeria aproximadamente US$ 1 bi/ano; o modelo de nuvem teria cerca de 1,2 trilhão de parâmetros. A Apple teria tentado primeiro usar seu próprio hardware PCC para tarefas pesadas, mas o achou lento demais, levando ao acordo com o Google Cloud.
O Gemini treinou o AFM 3 Cloud Pro da Apple via destilação de conhecimento; os modelos no dispositivo da Apple não têm envolvimento do Google e as interações do iPhone nunca chegam ao Google.
O modelo no dispositivo da Apple vs um LLM local auto-hospedado
O modelo no dispositivo da Apple e um LLM de pesos abertos auto-hospedado processam em hardware local — mas as diferenças são significativas:
| Apple AFM 3 Core Advanced (on-device) | Self-hosted local LLM (Qwen / Llama / Gemma) | |
|---|---|---|
| Tamanho do modelo | 20B esparso; ativa 1–4B parâmetros/prompt (Instruction-Following Pruning) | Sua escolha: 3B–70B+ |
| Controle | Bloqueado no SO da Apple; não trocável | Total: qualquer modelo, quantização e ferramenta |
| Capacidade offline | Camada no dispositivo offline; tarefas pesadas vão para a nuvem | Totalmente offline se desejar |
| Privacidade | Forte para a camada no dispositivo; camadas de nuvem processam seu pedido | Absoluta — nada sai da sua máquina |
| Abertura | Pesos fechados; apenas ecossistema Apple | Pesos abertos; inspecionáveis e ajustáveis |
| Atualização/troca de modelo | Apple controla o calendário de lançamentos | Você decide quando atualizar ou trocar |
O que significa para os usuários: privacidade na prática
A questão prática: meus dados ficam no dispositivo? A resposta depende completamente de qual camada processa a tarefa. A Apple oferece alguma transparência, mas você não pode observar diretamente qual camada é acionada para determinado pedido.
| What you ask | Which tier? | Leaves device? | Touches Google Cloud? |
|---|---|---|---|
| Ditado, temporizador, resposta rápida | No dispositivo | Não | Não |
| Resumir um longo tópico de e-mails | PCC ou Cloud Pro | Sim | Possivelmente (Cloud Pro) |
| Pesquisa complexa ou escrita criativa | Cloud Pro | Sim | Sim |
| LLM auto-hospedado via Ollama | Sua máquina | Nunca | Nunca |
Mantenha notas médicas, documentos jurídicos e dados empresariais confidenciais fora do Apple Intelligence se não puder garantir a camada no dispositivo. Para residência de dados verificada, LLMs locais auto-hospedados continuam sendo a única opção confirmada.
O que significa para desenvolvedores e empresas
A história para desenvolvedores na WWDC 2026 tem menos a ver com qualidade do modelo e mais com superfície de ação. A Apple está expandindo os App Intents para que o Apple Intelligence possa chamar apps de terceiros — mas apenas por meio de ações e estruturas de dados explicitamente declaradas. A Siri não raspa a UI; ela chama intents declarados.
Isso é funcionalmente análogo ao GEO (Generative Engine Optimization). Em vez de estruturar conteúdo para rastreadores de IA, você estrutura a superfície de ação que seu app expõe ao modelo do SO. Apps com App Intents limpos e granulares aparecerão nos resultados do Apple Intelligence; os que não tiverem, não.
Para empresas reguladas pela UE/LGPD: a camada no dispositivo fornece residência de dados por padrão, podendo satisfazer o Art. 32 do GDPR para tarefas simples. A camada Cloud Pro roteia dados para o Google Cloud (EUA), levantando as mesmas questões de transferência do Capítulo V que qualquer outro serviço de nuvem americano.
A avaliação honesta
A Apple acabou de tornar a 'IA privada no dispositivo' uma expectativa mainstream para cerca de um bilhão de usuários — essa validação da abordagem local-first importa. Mas o Apple Intelligence é um sistema híbrido, parcialmente respaldado pelo Google, de pesos fechados: uma porta de entrada para a mentalidade de IA local, não um substituto para rodar seus próprios modelos.
Se privacidade é sua motivação principal, a arquitetura de três camadas introduz ressalvas reais: as camadas de nuvem processam seus pedidos, a camada Cloud Pro roda na infraestrutura do Google Cloud nos EUA, e você não controla os pesos, a lógica de roteamento nem o calendário de atualizações.
LLMs locais auto-hospedados — Qwen, Llama, Gemma no seu próprio hardware — continuam sendo a única arquitetura onde você pode verificar que nada sai do seu ambiente.
Para usuários da UE: o no dispositivo oferece residência de dados para tarefas simples. Para tarefas complexas roteadas ao Google Cloud, aplica-se a mesma análise do Capítulo V do GDPR que para qualquer outro serviço de nuvem americano.
Perguntas frequentes
Apple Intelligence é um LLM local?
Não exatamente. Apple Intelligence é um sistema híbrido de três camadas. Tarefas simples usam o modelo no dispositivo (AFM Core / AFM 3 Core Advanced), que roda no Apple Silicon e nunca sai do dispositivo. Tarefas intermediárias vão para os servidores Private Cloud Compute da Apple. Tarefas complexas vão para o AFM 3 Cloud Pro em GPUs Nvidia no Google Cloud. Apenas a primeira camada qualifica como modelo local de verdade.
A Apple usa o Gemini no meu iPhone?
Não. Os modelos no dispositivo — AFM Core e AFM 3 Core Advanced — são da Apple e não têm nenhum envolvimento do Google. O Gemini foi usado como sinal de treinamento para o modelo de nuvem (AFM 3 Cloud Pro), mas o Gemini em si não roda no seu dispositivo. Suas interações no dispositivo com o Apple Intelligence não chegam ao Google.
Meus dados são enviados ao Google?
Apenas para tarefas roteadas para a camada Cloud Pro (AFM 3 Cloud Pro), que roda em GPUs Nvidia no Google Cloud. Tarefas simples no dispositivo nunca saem do seu aparelho. Tarefas intermediárias vão para o Private Cloud Compute da Apple (não Google). Tarefas de raciocínio complexo passam pela infraestrutura do Google Cloud.
Qual o tamanho do modelo no dispositivo da Apple?
O AFM 3 Core Advanced da Apple é um modelo esparso de 20B que ativa apenas 1–4B parâmetros por prompt via Instruction-Following Pruning, tornando-o eficiente o suficiente em memória para rodar nos chips do iPhone e Mac.
Posso rodar meu próprio LLM local em vez do Apple Intelligence?
Sim. O Ollama (gratuito, multiplataforma) permite rodar modelos de pesos abertos — Qwen, Llama, Gemma — completamente no seu próprio hardware. Diferente do Apple Intelligence, LLMs auto-hospedados são totalmente offline, usam pesos abertos que você pode inspecionar e ajustar, e não passam pela infraestrutura da Apple ou do Google.
Apple Intelligence é suficientemente privado para o RGPD da UE?
A camada no dispositivo oferece forte residência de dados — os dados nunca saem do chip Apple Silicon, podendo satisfazer o Art. 32 do GDPR para tarefas simples. A camada Cloud Pro roteia para o Google Cloud (EUA), levantando questões de transferência do Capítulo V do GDPR. Empresas da UE que lidam com dados pessoais sensíveis devem realizar uma DPIA e confirmar quais tarefas do Apple Intelligence ficam no dispositivo.
A Siri funciona offline após a WWDC 2026?
Para tarefas no dispositivo — ditado, respostas rápidas, reconhecimento de tela — sim, a Siri funciona sem conexão à internet. Tarefas que requerem Private Cloud Compute ou Cloud Pro precisam de conectividade.
O que são homeOS e HomePad?
homeOS é um novo sistema operacional apresentado na WWDC 2026 para dispositivos hub de casa inteligente. A Apple mostrou uma prévia para desenvolvedores ligada ao futuro HomePad. Especificações e data de lançamento do HomePad não foram anunciadas na WWDC 2026.