Apple expérimente une nouvelle technologie de génération d'images et de vidéos

Stéphane Moussie

jeudi 09 novembre 2023 à 16:07 • 26

Tim Cook le répète à l'envi depuis quelques mois : Apple prend au sérieux l'intelligence artificielle générative. Très bien, mais pour faire quoi ? On commence à le découvrir avec la parution d'un rapport technique par des chercheurs en IA de l'entreprise.

Images générées par les chercheurs d'Apple avec les Matryoshka Diffusion Models.

Dans ce document de recherche, les spécialistes d'Apple présentent une nouvelle famille de modèles de génération d'images et de vidéos en haute définition. Ces modèles se distinguent des autres par le fait qu'ils n'ont pas besoin d'être entraînés avec des modules d'upscaling pour générer des contenus en haute définition.

Le principe de la technologie transparait dans son nom, Matryoshka Diffusion Models : à chaque étape de la génération d'image, le modèle « emboîte » le travail réalisé sur la résolution inférieure dans la résolution supérieure, à l'image des poupées russes qui s'emboîtent les unes dans les autres. D'après les chercheurs d'Apple, cette méthode consistant à partager les représentations à travers différentes résolutions conduit à accélérer l'entraînement avec des résultats de grande qualité.

Schéma du fonctionnement de Matryoshka Diffusion Models. Graphique Apple.

Ces modèles peuvent servir à augmenter la définition d'une petite image ou à générer du contenu à partir d'une commande de texte, ce qui ouvre de nombreuses utilisations possibles. Dans leur point d'étape, les experts ne précisent pas la puissance de calcul nécessaire pour ces opérations, un point évidemment crucial en vue d'une éventuelle intégration aux systèmes d'exploitation et aux applications d'Apple.

Bloomberg a récemment affirmé qu'Apple voulait mettre de l'IA un peu partout dans son écosystème (Siri, Xcode, iWork, Apple Music…), mais le domaine de l'image n'était pas évoqué dans ce premier plan.