The Information revient sur les plans d’Apple en matière d’intelligence artificielle qui devraient occuper une large part de la WWDC 2026. Si le titre de l’article laisse entendre que la Pomme insistera surtout sur l’IA en local pendant la conférence, le contenu rappelle en revanche que des serveurs seront nécessaires, surtout au lancement. Pas ceux d’Apple, c’est l’infrastructure cloud de Google qui serait principalement sollicitée pour le nouveau Siri et les autres fonctionnalités liées à Apple Intelligence.
D’après les sources du site, en général très bien informé, Apple devrait mettre en avant ses quinze années d’expérience dans la conception de puces maison destinées à tous ses appareils. La vidéo devrait ainsi insister sur l’avantage apporté par cette expertise pour exécuter des modèles IA en local, sans dépendre de serveurs distants et sans les inconvénients associés (dépendance à une connexion internet, risque de fuite, prix de fonctionnement plus élevés, etc.). Ce n’est pas une surprise après tout, c’est un discours que l’on a déjà entendu par le passé, en particulier lors de la WWDC 2024.
À l’époque, l’entreprise comptait uniquement sur ses propres modèles, avec les résultats pour le moins mitigés que l’on connaît. Cette fois, Apple peut exploiter son accord avec Google, qui lui donne accès à Gemini. The Information rappelle une de ses précédentes rumeurs, en indiquant que la technique de distillation devrait servir à « convertir » un gros modèle Gemini en une variante suffisamment légère pour être utilisable sur les iPhone, iPad et Mac.
Apple pourrait distiller Gemini pour alimenter le nouveau Siri
Apple envisagerait aussi d’acheter des startups spécialisées dans les petits modèles légers, pour l’aider dans cet effort. D’après le site, l’entreprise aurait hésité à faire une offre pour récupérer Liquid AI, un spécialiste qui travaille notamment avec l’industrie automobile. L’utilisation d’une variante distillée de Gemini suggère qu’il n’y aura pas de modèle conçu en interne, du moins pas pour l’essentiel.
Malgré ces efforts sur l’IA locale, les modèles les plus costauds fournis par Google auront besoin de serveurs puissants et en grand nombre. D’ailleurs, nos confrères suggèrent que l’infrastructure mise au point par Apple ne serait pas à la hauteur. La firme de Tim Cook aurait essayé de faire tourner Gemini sur le Private Cloud Compute mis en place depuis 2024 avec des serveurs conçus en interne, mais cela aurait été un échec. En conséquence, la partie serveur d’Apple Intelligence dépendrait largement de Google Cloud.
Apple pourrait malgré tout maintenir ses engagements en matière de vie privée, notamment parce que Google a largement copié le Private Cloud Compute pour ses propres besoins… et peut-être en anticipant ceux de son futur partenaire. Toujours dans cette idée d’assurer une excellente sécurité des données, Apple aurait aussi signé un accord pour utiliser un nouveau système conçu par Nvidia et utilisé par Google Cloud. Grâce à lui, les données qui transitent par les GPU restent chiffrées de bout en bout, ce qui est une des promesses fondamentales d’Apple Intelligence.
Google s’inspire du Private Cloud Compute d’Apple pour imaginer le Private AI Compute
The Information souligne que cet accord lié à Nvidia serait très récent, on parle des dernières semaines. C’est peut-être le signe qu’Apple a finalement abandonné l’idée d’utiliser ses propres serveurs et qu’elle dépendra entièrement de Google Cloud pour Apple Intelligence, en tout cas au lancement.
Il ne faudrait toutefois pas s’attendre à une reconnaissance publique de cette concession, pour ne pas dire échec. Même si ce ne sont plus ses machines qui sont à la manœuvre, la Pomme devrait quand même parler de Private Cloud Compute pour qualifier cette IA en ligne, comme elle l’a fait depuis 2024.













