Un système hybride entre appareil et cloud
Lors de sa conférence annuelle des développeurs, Apple a détaillé le fonctionnement de son nouvel assistant Siri, propulsé par l'intelligence artificielle et annoncé sous le nom de « Siri AI ». Pour les tâches les plus simples, le système s'appuie sur des modèles exécutés directement sur l'appareil de l'utilisateur. Les versions récentes des systèmes d'exploitation intègrent un modèle dit « AFM 3 Core », développé conjointement par Apple et Google, tandis que les appareils les plus puissants (Mac équipés d'une puce M3 ou plus récente, iPad doté d'une puce M4 ou plus récente, et iPhone doté de la puce A19 Pro) bénéficient d'une version avancée, « AFM 3 Core Advanced », qui exploite davantage de mémoire vive et de stockage pour améliorer la dictée et la voix de l'assistant.
Pour les requêtes plus complexes, l'appareil contacte des modèles hébergés dans le cloud. Apple a détaillé trois modèles : le « AFM 3 Cloud », un modèle généraliste ; le « ADM 3 Cloud », dédié à la génération d'images ; et le « AFM 3 Cloud Pro », un modèle avancé destiné à « l'utilisation d'outils agentiques et au raisonnement complexe ». Les deux premiers modèles sont exécutés sur des serveurs appartenant à Apple et utilisant ses propres puces. Le modèle Pro, en revanche, fonctionne sur du matériel Nvidia hébergé dans les centres de données de Google.
Un « cloud privé » étendu aux serveurs de Google
Pour préserver la confidentialité des utilisateurs dans ce cadre, Apple a développé une nouvelle itération de son système « Private Cloud Compute » (PCC), capable de fonctionner sur du matériel tiers. Ce système combine plusieurs technologies pour créer des enclaves sécurisées : la technologie de calcul confidentiel de Nvidia (« Confidential Computing »), les extensions de domaine de confiance d'Intel (« Trust Domain Extensions ») et la puce de sécurité Titan de Google. Apple explique que ces couches de protection empêchent Google d'accéder aux données traitées.
Lors d'une session de questions-réponses avec la presse, Craig Federighi, vice-président senior en charge de l'ingénierie logicielle chez Apple, a illustré cette séparation en présentant un transparent vierge, déclarant : « Voici la quantité du système Google que nous utilisons, c'est-à-dire aucune. » Il a décrit l'architecture traditionnelle des chatbots, où une application cliente contacte des modèles sur des serveurs tiers, qui peuvent ensuite interroger des sources externes comme Google Search. L'architecture d'Apple, selon lui, rompt ce schéma.
Un registre infalsifiable du matériel utilisé
Pour garantir la sécurité de l'ensemble, Apple tient un registre cryptographique « infalsifiable et en ajout seulement » de tous les serveurs Google Cloud faisant partie de la flotte PCC. Les appareils d'Apple sont configurés pour n'accorder leur confiance qu'aux logiciels installés sur ces serveurs qui sont signés par Apple. Le « System Orchestrator », un composant logiciel fonctionnant sur l'appareil de l'utilisateur, est chargé de décisions cruciales, comme le choix du modèle à utiliser et les applications autorisées à accéder aux données.
Les serveurs de Google Cloud ne prennent pas encore en charge l'ensemble des protections offertes par les propres serveurs PCC d'Apple. Le constructeur a indiqué qu'il « renforcerait progressivement l'ensemble des protections tout au long de la période de prévisualisation estivale ».
Un virage qui soulève des questions
Ce partenariat avec Google marque un changement de cap pour Apple, qui avait jusqu'à présent évité de déployer massivement ses propres centres de données pour l'intelligence artificielle. La société a longtemps mis en avant le traitement sur l'appareil comme un gage de protection de la vie privée. Mais avec « Apple Intelligence », elle a atteint les limites de son propre matériel pour faire fonctionner des modèles de langage et de raisonnement de grande taille. Le système PCC, initialement développé pour ses propres serveurs, n'était qu'une solution partielle face à la capacité nécessaire. En utilisant les infrastructures de Nvidia chez Google, Apple évite un investissement colossal dans ses propres datacenters, tout en affirmant maintenir le même niveau de confidentialité.