Skip to main content
PromptQuorumPromptQuorum
ホーム/ローカルLLM/AppleのオンデバイスAI対ローカルLLM:WWDC 2026で実際に何が変わったか
Privacy & Business

AppleのオンデバイスAI対ローカルLLM:WWDC 2026で実際に何が変わったか

·10分で読める·Hans Kuepper 著 · PromptQuorumの創設者、マルチモデルAIディスパッチツール · PromptQuorum

Apple Intelligenceは3層ハイブリッドです:オンデバイスAFM Core(純AppleでGoogleとの接点ゼロ)、Private Cloud Compute(Appleサーバー)、AFM 3 Cloud Pro(Google Cloud上のNvidia GPU、Geminiで精錬)。自前のローカルLLMを運用することで、いかなるAppleの層でも実現できない完全なモデル制御、オープンウェイト、絶対的なオフラインプライバシーが得られます。

WWDC 2026(6月8日、Tim CookがCEOとして最後に登壇したキーノート)で、AppleはAI戦略をオンデバイスとクラウドのハイブリッドアーキテクチャとGoogleとの新たなパートナーシップを中心に再構築しました。ローカルLLMを運用している人にとって、重要な問いはSiriが賢くなったかどうかではなく、デバイス上で何が動いているか、何が外部に出ていくか、そしてQwenやLlamaを自前で動かすことと何が違うのか、という点です。

重要なポイント

  • Apple Intelligenceは3層ハイブリッド——オンデバイスAFM Core(純Apple、Google接点ゼロ)、Private Cloud Compute(Appleサーバー)、AFM 3 Cloud Pro(Google Cloud上のNvidia GPU、Gemini出力で精錬)。
  • iPhoneのオンデバイスモデルは純粋なApple製——AFM Core / AFM 3 Core Advancedは20Bスパースで、Instruction-Following Pruningにより1プロンプトあたり1〜4Bパラメータを活性化。
  • Geminiはティーチャーシグナルであってランタイムではない——AppleのクラウドモデルはGemini出力で精錬されたが、Gemini自体はデバイス上で動作していない。
  • セルフホストのローカルLLMはAppleには不可能な制御を提供——オープンウェイト、自由な量子化、任意のツール、完全オフライン、モデル交換可能。
  • WWDC 2026(6月8日、Tim CookのCEO最後のキーノート):6つのOSベータ、専用Siriアプリ(iCloudで履歴同期)、HomePad向けhomeOSプレビュー。
  • EU/GDPR:オンデバイス=デフォルトでデータが端末内に留まる。Cloud ProはGoogle Cloud(米国)を経由——第V章の越境移転問題が適用される。

WWDC 2026でAppleが発表したこと

WWDC 2026は6月8日、Tim CookがCEOとして最後に登壇したキーノートで幕を開けました。目玉はAI戦略の刷新:iCloudで会話履歴を同期する専用のSiriアプリ、6つのOSのベータ版(iOS 27、iPadOS 27、macOS 27、watchOS 27、tvOS 27、visionOS 27——正式リリースは2026年秋予定)、そして次期HomePadスマートホームハブに向けたhomeOS開発者プレビューです。

AI層はApple Intelligenceと呼ばれ、Gemini技術を用いてGoogleと共同開発されました。オンデバイスモデル(AFM Core / AFM 3 Core Advanced)はApple独自のものです。クラウドモデル(AFM 3 Cloud Pro)はGeminiの出力を用いて精錬され、Google Cloud上のNvidia GPUで動作します。

📍 一文で説明

WWDC 2026でAppleはApple Intelligenceを3層ハイブリッドとして発表した:オンデバイスAFMモデル(純Apple)、Private Cloud Compute(Appleサーバー)、Google Cloud上のNvidia GPUで動作するAFM 3 Cloud Pro(Gemini出力で精錬)。

💬 簡潔に説明

Apple IntelligenceはAppleのオンデバイスAIシステムです。シンプルなタスク(音声入力、クイック返信)はiPhoneのチップ上で完全に処理され、デバイスを離れることはありません。より複雑なタスクはAppleのクラウドサーバーに送られることがあります。最も複雑な推論タスクは、GoogleのGeminiを使って一部訓練されたAppleモデルが動作するGoogle Cloudサーバーに送られます。

3層アーキテクチャ:何がどこで動くか

Apple Intelligenceは複雑さに応じて各タスクを3層のうちの1つに振り分けます。どの層にあたるかがプライバシー保証を決定します。

TierWhere it runsWhat it handlesTouches Google?
オンデバイスApple Siliconチップ(AFM Core / AFM 3 Core Advanced)音声入力、画面認識、個人コンテキスト検索、クイックタスクいいえ——純Apple。Google、Gemini、検索との接点ゼロ
Private Cloud Compute (PCC)Apple Siliconサーバー(証明済み・コード監査済み)デバイスより多くの計算を必要とする中程度のタスクいいえ——第三者データアクセスなし
Cloud ProGoogle Cloud上のNvidia GPU(AFM 3 Cloud Pro)最も重い世界知識タスクと複雑な推論はい——Google Cloudインフラ使用;Gemini出力でモデル精錬

Geminiはティーチャー、ランタイムではない

WWDC 2026で最も誤解されているのはGoogleとの関係です。Appleは「Geminiで訓練した」と「Geminiである」を明確に区別しています。オンデバイスモデル(AFM CoreとAFM 3 Core Advanced)はApple独自のもので、Googleとの接点は一切ありません。オンデバイスのやり取りはGoogleに送られることはありません。

クラウドモデル(AFM 3 Cloud Pro)は異なります。Google Cloud上のNvidia GPUで動作します。Appleは、このモデルがGemini出力を使って精錬されたと述べています——Geminiの出力が訓練シグナルとして使われた知識蒸留プロセスです。結果はApple独自のモデルですが、Googleのインフラ上でホストされています。

報告されている(未確認)情報:このパートナーシップは年間約10億ドル規模とされ、クラウドモデルは約1.2兆パラメータとも言われています。AppleはまずPrivate Cloud Computeハードウェアで重いタスクを処理しようとしたが遅すぎたため、Google Cloudの採用に至ったとも報じられています。

📍 一文で説明

GeminiはAppleのAFM 3 Cloud Proを知識蒸留で訓練したティーチャーモデル;オンデバイスのAppleモデルにはGoogleの関与は一切なく、iPhoneのやり取りはGoogleに送られない。

Appleオンデバイスモデル対セルフホストのローカルLLM

AppleのオンデバイスモデルとセルフホストのオープンウェイトLLMはどちらもローカルハードウェアで処理しますが、違いは大きいです:

Apple AFM 3 Core Advanced (on-device)Self-hosted local LLM (Qwen / Llama / Gemma)
モデルサイズ20Bスパース;Instruction-Following Pruningで1〜4Bパラメータ/プロンプトを活性化ユーザーが選択:3B〜70B+
制御性Apple OSに固定;交換不可完全:モデル、量子化、ツールを自由に選択
オフライン対応オンデバイス層はオフライン可;重いタスクはクラウドへ希望すれば完全オフライン
プライバシーオンデバイス層は強力;クラウド層はリクエストを処理絶対的——何もデバイスを離れない
オープン性非公開ウェイト;Appleエコシステム専用オープンウェイト;検査・ファインチューニング可能
モデル更新/切り替えAppleがリリーススケジュールを管理更新や切り替えのタイミングをユーザーが決定

ユーザーへの意味:実践的なプライバシー

ユーザーが抱く実際の疑問:データはデバイスに留まるのか?答えはどの層がタスクを処理するかに完全に依存します。Appleはある程度の透明性を提供していますが、特定のリクエストでどの層が起動されるかを直接確認する方法はありません。

What you askWhich tier?Leaves device?Touches Google Cloud?
音声入力、タイマー設定、クイック返信オンデバイスいいえいいえ
長いメールスレッドの要約PCCまたはCloud Proはい可能性あり(Cloud Pro)
複雑なリサーチや創作Cloud Proはいはい
OllamaによるセルフホストLLM自分のマシン絶対にいいえ絶対にいいえ

医療メモ、法的文書、機密ビジネスデータはオンデバイス層での処理を保証できない場合、Apple Intelligenceへの入力を避けてください。データ保存先を確実に把握するには、セルフホストのローカルLLMが唯一の確認済み選択肢です。

デベロッパーと企業への意味

WWDC 2026のデベロッパー向けの話は、モデルの品質よりもサーフェスエリアに関するものです。AppleはApp IntentsをApple Intelligenceがサードパーティアプリを呼び出せるよう拡張していますが、それは明示的に宣言されたアクションとデータ構造を通じてのみです。SiriはUIをスクレイピングするのではなく、宣言されたインテントを呼び出します。

これはGEO(Generative Engine Optimization)と機能的に似ています。AIクロウラー向けにコンテンツを構造化する代わりに、アプリがOSモデルに公開するアクションサーフェスを構造化します。クリーンで細かいApp Intentsを宣言したアプリはApple Intelligenceの結果に表示され、そうでないアプリは表示されません。

EU/GDPR規制を受ける企業向け:オンデバイス層はデフォルトでデータ保存場所を確保し、シンプルなタスクについてはGDPR第32条の要件を満たす可能性があります。Cloud Pro層はGoogle Cloud(米国)を経由するため、他の米国クラウドサービスと同じ第V章の越境移転の問題が生じます。法務チームはApple IntelligenceがDPIA対象かどうかを評価する必要があります。

率直な評価

「プライベートなオンデバイスAI」をおよそ10億人のデバイスオーナーにとっての主流の期待にしたAppleの功績は認められるべきです——ローカルファーストのアプローチへのこの支持は重要です。しかしApple Intelligenceは、ハイブリッドで、一部Googleが支援する、クローズドウェイトのシステムです:ローカルAIのマインドセットへの入り口であり、自前のモデルを動かすことの代替ではありません。

プライバシーが主な動機であるなら、3層アーキテクチャには本物の注意点があります:クラウド層がリクエストを処理し、Cloud Pro層は米国のGoogle Cloudインフラ上で動作し、ウェイト、ルーティングロジック、更新スケジュールのいずれも制御できません。

Qwen、Llama、Gemmaなど、自前のハードウェアで動かすセルフホストのローカルLLMは、何も自分の環境を離れないことを確認できる唯一のアーキテクチャのままです。

EUのユーザー向け:シンプルなタスクではオンデバイスがデフォルトでデータ保存場所を確保します。Google Cloudにルーティングされる複雑なタスクについては、他の米国クラウドサービスと同じGDPR第V章の分析が適用されます。

よくある質問

Apple Intelligenceはローカルなのか?

厳密には違います。Apple Intelligenceは3層ハイブリッドシステムです。シンプルなタスクはオンデバイスモデル(AFM Core / AFM 3 Core Advanced)を使用し、Apple Silicon上で動作し、デバイスを離れません。中程度のタスクはAppleのPrivate Cloud Computeサーバーに送られます。複雑なタスクはGoogle Cloud上のNvidia GPUで動作するAFM 3 Cloud Proに送られます。本当のローカルモデルに相当するのは最初の層のみです。

AppleはiPhoneにGeminiを使っているのか?

いいえ。オンデバイスモデル(AFM CoreとAFM 3 Core Advanced)はApple製であり、Googleとの接点は一切ありません。Geminiはクラウドモデル(AFM 3 Cloud Pro)の訓練のためにティーチャーシグナルとして使用されましたが、Gemini自体はデバイス上で動作していません。オンデバイスのApple Intelligenceのやり取りはGoogleに送られません。

データはGoogleに送られるのか?

Google Cloud上のNvidia GPUで動作するCloud Pro層(AFM 3 Cloud Pro)にルーティングされるタスクのみです。シンプルなオンデバイスタスクはデバイスを離れません。中程度のタスクはAppleのPrivate Cloud Compute(Googleではない)に送られます。複雑な推論タスクはGoogle Cloudインフラを経由します。

Appleのオンデバイスモデルのサイズは?

AppleのAFM 3 Core Advancedは、Instruction-Following Pruningにより1プロンプトあたり1〜4Bパラメータのみを活性化する20Bスパースモデルです。これにより、一般的な日常タスクで競争力を保ちながら、iPhoneやMacのチップで動作するのに十分なメモリ効率を実現しています。

Apple Intelligenceの代わりに自前のローカルLLMを動かせるか?

はい。Ollama(無料、クロスプラットフォーム)を使えば、Qwen、Llama、Gemmaなどのオープンウェイトモデルをすべてローカルのハードウェアで動かせます。Apple Intelligenceと異なり、セルフホストのLLMは完全オフラインで動作し、検査・ファインチューニング可能なオープンウェイトを使用し、AppleやGoogleのインフラを一切経由しません。

Apple IntelligenceはEU/GDPRに対して十分なプライバシー保護があるか?

オンデバイス層は強力なデータ保存場所を提供します——データはApple Siliconチップを離れず、シンプルなタスクについてはGDPR第32条を満たす可能性があります。Cloud Pro層はGoogle Cloud(米国)にルーティングされ、GDPR第V章の越境移転の問題が生じます。機密性の高い個人データを扱うEU企業はDPIAを実施し、Apple Intelligenceのどのタスクがオンデバイスに留まるかを確認する必要があります。

WWDC 2026後、Siriはオフラインで機能するか?

オンデバイスタスク(音声入力、クイック返信、画面認識)についてはインターネット接続なしで機能します。Private Cloud ComputeまたはCloud Proが必要なタスクには接続が必要です。

homeOSとHomePadとは何か?

homeOSはWWDC 2026でスマートホームハブデバイス向けに発表された新しいOSです。Appleは次期HomePadに向けた開発者プレビューを公開しました。HomePadのスペックとリリース日はWWDC 2026では発表されませんでした。

サードパーティの情報に関する注意

この記事はサードパーティのAIモデル、ベンチマーク、価格、ライセンスを参照しています。AIの状況は急速に変化しています。ベンチマークスコア、ライセンス条件、モデル名、API価格は執筆時とお読みになる時の間で変わる可能性があります。この記事に基づいてデプロイやコンプライアンスに関する決定を下す前に、各プロバイダーの公式ソース(ライセンスとベンチマークはHugging Faceのモデルカード、API価格はプロバイダーのウェブサイト、現在のGDPRとEU AI法のテキストはEUR-Lex)で最新の数値を確認してください。この記事は2026年5月時点で公開されている情報を反映しています。

ローカルLLM、独自のAPIキー、またはその両方でPromptQuorumを使用できます — バックエンドはあなたが選択します。

PromptQuorumウェイトリストに参加する →

← ローカルLLMに戻る

Apple WWDC 2026:オンデバイスAIとローカルLLMの比較分析 | PromptQuorum