Key Takeaways
- Apple Intelligence es un híbrido de tres niveles — AFM Core on-device (Apple puro, cero Google), Private Cloud Compute (servidores Apple) y AFM 3 Cloud Pro (GPUs Nvidia en Google Cloud, refinado con Gemini).
- El modelo on-device de tu iPhone es Apple puro — AFM Core / AFM 3 Core Advanced es 20B disperso, activa 1–4B parámetros por prompt via Instruction-Following Pruning.
- Gemini es una señal de entrenamiento, no el runtime — el modelo cloud de Apple fue refinado con outputs de Gemini; Gemini en sí no se ejecuta en tu dispositivo.
- Los LLM locales auto-alojados dan un control que Apple no puede ofrecer — pesos abiertos, cuantización libre, cualquier herramienta, totalmente offline, modelos intercambiables.
- WWDC 2026 (8 de junio, último keynote de Tim Cook como CEO): seis betas de OS, app Siri dedicada con historial en iCloud, vista previa homeOS para HomePad.
- UE/RGPD: on-device = residencia de datos por defecto; Cloud Pro pasa por Google Cloud (EE.UU.), aplicando las cuestiones de transferencia del Capítulo V.
Qué anunció Apple en WWDC 2026
La WWDC 2026 abrió el 8 de junio con el último keynote de Tim Cook como CEO. El titular fue una estrategia de IA renovada: una nueva app Siri dedicada con historial de conversaciones sincronizado por iCloud, seis OS en beta (iOS 27, iPadOS 27, macOS 27, watchOS 27, tvOS 27, visionOS 27 — lanzamiento completo previsto para otoño de 2026) y una vista previa de homeOS para desarrolladores ligada al próximo hub HomePad.
La capa de IA se llama Apple Intelligence, ahora co-desarrollada con Google usando tecnología Gemini. Los modelos on-device (AFM Core / AFM 3 Core Advanced) son de Apple. El modelo cloud (AFM 3 Cloud Pro) fue refinado con outputs de Gemini y se ejecuta en GPUs Nvidia en Google Cloud.
En WWDC 2026, Apple presentó Apple Intelligence como un híbrido de tres niveles: modelos AFM on-device (Apple puro), Private Cloud Compute (servidores Apple) y AFM 3 Cloud Pro en GPUs Nvidia en Google Cloud (refinado con Gemini).
Apple Intelligence es el sistema de IA on-device de Apple. Las tareas sencillas (dictado, respuestas rápidas) se ejecutan completamente en el chip del iPhone y nunca salen del dispositivo. Las tareas más complejas pueden ir a servidores en la nube de Apple. Las tareas de razonamiento más complejas van a un servidor de Google Cloud que ejecuta un modelo de Apple entrenado en parte con Gemini.
La arquitectura de tres niveles: qué se ejecuta dónde
Apple Intelligence enruta cada tarea a uno de tres niveles según su complejidad. Qué nivel procesa la tarea determina la garantía de privacidad.
| Tier | Where it runs | What it handles | Touches Google? |
|---|---|---|---|
| On-device | Chip Apple Silicon (AFM Core / AFM 3 Core Advanced) | Dictado, reconocimiento de pantalla, búsquedas de contexto personal, tareas rápidas | No — Apple puro. Cero código Google, Gemini o Search |
| Private Cloud Compute (PCC) | Servidores Apple Silicon (certificados, auditados) | Tareas intermedias que requieren más cómputo que el dispositivo | No — sin acceso de terceros a los datos |
| Cloud Pro | GPUs Nvidia en Google Cloud (AFM 3 Cloud Pro) | Tareas de conocimiento del mundo más pesadas y razonamiento complejo | Sí — infraestructura Google Cloud; modelo refinado con outputs de Gemini |
Gemini es un maestro, no el modelo en producción
La parte más malinterpretada de WWDC 2026 es la relación con Google. Apple distingue cuidadosamente entre 'entrenado con Gemini' y 'es Gemini'. Los modelos on-device — AFM Core y AFM 3 Core Advanced — son de Apple y no tienen ninguna implicación de Google. Las interacciones on-device nunca llegan a Google.
El modelo cloud (AFM 3 Cloud Pro) es diferente. Se ejecuta en GPUs Nvidia en Google Cloud. Apple indica que el modelo fue refinado usando outputs de Gemini — un proceso de destilación de conocimiento donde los outputs de Gemini sirvieron como señal de entrenamiento. El resultado es el propio modelo de Apple, pero alojado en infraestructura de Google.
Reportado (sin confirmar): la colaboración valdría aproximadamente 1.000 M$/año; el modelo cloud tendría alrededor de 1,2 billones de parámetros. Apple habría intentado primero usar su propio hardware PCC para tareas pesadas, pero resultó demasiado lento, lo que llevó al acuerdo con Google Cloud.
Gemini entrenó el AFM 3 Cloud Pro de Apple mediante destilación de conocimiento; los modelos on-device no tienen ningún vínculo con Google y las interacciones del iPhone nunca llegan a Google.
El modelo on-device de Apple vs un LLM local auto-alojado
El modelo on-device de Apple y un LLM de pesos abiertos auto-alojado procesan en hardware local — pero las diferencias son significativas:
| Apple AFM 3 Core Advanced (on-device) | Self-hosted local LLM (Qwen / Llama / Gemma) | |
|---|---|---|
| Tamaño del modelo | 20B disperso; activa 1–4B parámetros/prompt (Instruction-Following Pruning) | Tu elección: 3B–70B+ |
| Control | Bloqueado en OS de Apple; no intercambiable | Total: cualquier modelo, cuantización y herramienta |
| Capacidad offline | Nivel on-device offline; tareas pesadas van a la nube | Totalmente offline si lo deseas |
| Privacidad | Fuerte para el nivel on-device; los niveles cloud procesan tu solicitud | Absoluta — nada sale de tu máquina |
| Apertura | Pesos cerrados; solo ecosistema Apple | Pesos abiertos; inspeccionables y ajustables |
| Actualización/cambio de modelo | Apple controla el calendario de lanzamiento | Tú decides cuándo actualizar o cambiar |
Qué significa para los usuarios: privacidad en la práctica
¿Mis datos se quedan en el dispositivo? La respuesta depende completamente de qué nivel procesa la tarea. Apple ofrece cierta transparencia, pero no puedes observar directamente qué nivel se activa para una solicitud concreta.
| What you ask | Which tier? | Leaves device? | Touches Google Cloud? |
|---|---|---|---|
| Dictado, temporizador, respuesta rápida | On-device | No | No |
| Resumir un hilo largo de correos | PCC o Cloud Pro | Sí | Posiblemente (Cloud Pro) |
| Investigación compleja o escritura creativa | Cloud Pro | Sí | Sí |
| LLM auto-alojado via Ollama | Tu máquina | Nunca | Nunca |
Mantén notas médicas, documentos legales y datos empresariales confidenciales fuera de Apple Intelligence si no puedes garantizar el nivel on-device. Para residencia de datos verificada, los LLM locales auto-alojados siguen siendo la única opción confirmada.
Qué significa para desarrolladores y empresas
La historia para desarrolladores de WWDC 2026 tiene menos que ver con la calidad del modelo y más con la superficie de acción. Apple extiende App Intents para que Apple Intelligence pueda llamar a apps de terceros — pero solo a través de acciones y estructuras de datos explícitamente declaradas. Siri no rastrea la UI; llama a intents declarados.
Esto es funcionalmente análogo al GEO (Generative Engine Optimization). En lugar de estructurar contenido para rastreadores de IA, estructuras la superficie de acción que tu app expone al modelo del OS. Las apps con App Intents limpios y granulares aparecerán en los resultados de Apple Intelligence; las que no los tengan, no.
Para empresas reguladas por UE/RGPD: el nivel on-device proporciona residencia de datos por defecto, lo que puede satisfacer el Art. 32 RGPD para tareas sencillas. El nivel Cloud Pro enruta datos a Google Cloud en EE.UU., planteando las mismas cuestiones de transferencia del Capítulo V que cualquier otro servicio cloud americano. Los equipos legales deben evaluar si Apple Intelligence entra en el alcance de su EIPD.
La valoración honesta
Apple acaba de convertir la 'IA privada on-device' en una expectativa mainstream para aproximadamente mil millones de usuarios — esa validación del enfoque local-first importa. Pero Apple Intelligence es un sistema híbrido, respaldado en parte por Google, de pesos cerrados: una puerta de entrada a la mentalidad de IA local, no un sustituto de ejecutar tus propios modelos.
Si la privacidad es tu motivación principal, la arquitectura de tres niveles introduce advertencias reales: los niveles cloud procesan tus solicitudes, el nivel Cloud Pro se ejecuta en infraestructura de Google Cloud en EE.UU., y no controlas los pesos, la lógica de enrutamiento ni el calendario de actualizaciones.
Los LLM locales auto-alojados — Qwen, Llama, Gemma en tu propio hardware — siguen siendo la única arquitectura donde puedes verificar que nada sale de tu entorno.
Para usuarios de la UE: el on-device ofrece residencia de datos para tareas sencillas. Para tareas complejas enrutadas a Google Cloud, se aplica el mismo análisis del Capítulo V del RGPD que para cualquier otro servicio cloud americano.
Preguntas frecuentes
¿Apple Intelligence es un LLM local?
No exactamente. Apple Intelligence es un híbrido de tres niveles. Las tareas sencillas usan el modelo on-device (AFM Core / AFM 3 Core Advanced), que se ejecuta en Apple Silicon y nunca sale del dispositivo. Las tareas intermedias van a los servidores Private Cloud Compute de Apple. Las tareas complejas van a AFM 3 Cloud Pro en GPUs Nvidia en Google Cloud. Solo el primer nivel califica como modelo local verdadero.
¿Apple usa Gemini en mi iPhone?
No. Los modelos on-device — AFM Core y AFM 3 Core Advanced — son de Apple y no tienen ninguna implicación de Google. Gemini fue usado como señal de entrenamiento para el modelo cloud (AFM 3 Cloud Pro), pero Gemini en sí no se ejecuta en tu dispositivo. Tus interacciones on-device con Apple Intelligence no llegan a Google.
¿Mis datos se envían a Google?
Solo para tareas enrutadas al nivel Cloud Pro (AFM 3 Cloud Pro), que se ejecuta en GPUs Nvidia en Google Cloud. Las tareas on-device sencillas nunca salen de tu dispositivo. Las tareas intermedias van a Private Cloud Compute de Apple (no Google). Las tareas de razonamiento complejo pasan por infraestructura de Google Cloud.
¿Qué tamaño tiene el modelo on-device de Apple?
El AFM 3 Core Advanced de Apple es un modelo disperso de 20B que activa solo 1–4B parámetros por prompt mediante Instruction-Following Pruning, haciéndolo suficientemente eficiente en memoria para ejecutarse en chips de iPhone y Mac.
¿Puedo ejecutar mi propio LLM local en lugar de Apple Intelligence?
Sí. Ollama (gratuito, multiplataforma) te permite ejecutar modelos de pesos abiertos — Qwen, Llama, Gemma — completamente en tu propio hardware. A diferencia de Apple Intelligence, los LLM auto-alojados son totalmente offline, usan pesos abiertos que puedes inspeccionar y ajustar, y no pasan por la infraestructura de Apple ni Google.
¿Apple Intelligence es suficientemente privado para el RGPD de la UE?
El nivel on-device ofrece residencia de datos fuerte — los datos nunca salen del chip Apple Silicon, pudiendo satisfacer el Art. 32 RGPD para tareas sencillas. El nivel Cloud Pro enruta a Google Cloud (EE.UU.), planteando cuestiones de transferencia del Capítulo V del RGPD. Las empresas de la UE que manejan datos personales sensibles deben realizar una EIPD y confirmar qué tareas de Apple Intelligence se mantienen on-device.
¿Funciona Siri sin conexión tras WWDC 2026?
Para tareas on-device — dictado, respuestas rápidas, reconocimiento de pantalla — sí, Siri funciona sin conexión a internet. Las tareas que requieren Private Cloud Compute o Cloud Pro necesitan conectividad.
¿Qué son homeOS y el HomePad?
homeOS es un nuevo sistema operativo presentado en WWDC 2026 para dispositivos hub de hogar inteligente. Apple mostró una vista previa para desarrolladores vinculada al próximo HomePad. Las especificaciones y la fecha de lanzamiento del HomePad no se anunciaron en WWDC 2026.