Ouvrir le menu principal

MacGeneration

Recherche

IA : Qualcomm s'intéresse à la génération d'images en local

Félix Cattafesta

mercredi 21 juin 2023 à 15:04 • 4

Ailleurs

Qualcomm s'intéresse aux modèles d'IA génératives tournant en local. L'entreprise vient de dévoiler ControlNet, un modèle de langage-vision dans la même veine que Stable Diffusion ou MidJourney. Une démo a été présentée, dans laquelle on peut voir une image générée sur un téléphone en moins de 12 secondes, sans passer par le cloud.

Qualcomm explique avoir utilisé une série d'optimisations au niveau de l'architecture du modèle, du logiciel d'IA et des accélérateurs du moteur neuronal pour obtenir ce résultat. La référence du téléphone utilisé n'est pas précisée, mais on peut voir que l'entreprise a mis la main à la pâte pour optimiser son modèle de 1,5 milliard de paramètres. Ce n'est pas la première fois que l'on peut utiliser un modèle du genre sur smartphone : une démo de Stable Diffusion sur Android a été présentée en début d'année. Sur iOS, il est possible de se servir du modèle de langage via des apps comme Draw Things ou AI Photo.

Le fait de pouvoir faire tourner des modèles d'IA générative en local est important : cela permet de moins dépendre du cloud, ce qui est toujours bon pour la protection de ses données privées. Si la nouveauté sert pour le moment à générer des images à partir de mots, elle pourrait rapidement infuser ici et là dans l'appareil. Qualcomm a par exemple dévoilé un modèle de langage utilisé pour donner voix à un coach de gym virtuel. Le concept se base sur un second modèle d'IA pouvant détecter et identifier les positions de gym, ce qui permet de générer des réponses dans le contexte.

La réalité mixte (au cœur du futur Vision Pro d'Apple) n'est pas en reste, et Qualcomm a également fait quelques annonces de ce côté-là. L'entreprise a notamment présenté un système de reconstruction 3D pour les apps XR mais aussi des avancées dans la création d'avatars 3D. Qualcomm a une carte à jouer dans le domaine : c'est elle qui produit les puces qui équipent les casques de Meta, principal opposant à Apple sur le terrain de la réalité mixte.

L'entreprise a également présenté ses avancées dans différents domaines, comme pour ce qui touche à l'encodage de vidéos 1080p sur smartphone ou de meilleurs algorithmes de vision par ordinateur pour les caméras de surveillance. Elle a aussi mis en avant un système de surveillance du conducteur pour véhicule, vérifiant l'état du chauffeur et le prévenant lorsqu'il détecte une pratique dangereuse (somnolence, distraction).

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

370 000 conversations en fuite chez xAI, dont certaines où Grok enfreint ses propres règles

20/08/2025 à 21:30

• 17


Test du Razer Thunderbolt 5 Dock : un pied dans le futur, un dans le passé

20/08/2025 à 21:00

• 3


Google dévoile quatre Pixel 10 aux améliorations nuancées

20/08/2025 à 20:37

• 42


D'importants correctifs de sécurité avec macOS 15.6.1 et iOS 18.6.2 [🆕 : iPadOS 17.7.10, macOS 14.7.8 et macOS 13.7.8 aussi proposés]

20/08/2025 à 19:48

• 14


Ces articles du Club iGen passent en accès libre : découvrez nos contenus premium

20/08/2025 à 17:01

• 2


Test du Corsair EX400U, un SSD USB4 parfait pour les Mac… et les iPhone

20/08/2025 à 17:00

• 19


inZOI : le concurrent aux Sims sous Unreal Engine 5 est désormais disponible pour les Mac M2

20/08/2025 à 16:52

• 7


Apple digère lentement Pixelmator

20/08/2025 à 15:26

• 25


Promo sur les bureaux assis-debout à 2 et 4 pieds de Flexispot

20/08/2025 à 13:30

• 11


Un clavier aux couleurs de Severance, pour ceux qui veulent raffiner des macrodonnées 🆕

20/08/2025 à 12:50

• 23


Acrobat Studio : les PDF passés à la moulinette IA par Adobe

20/08/2025 à 12:06

• 6


Une faille de sécurité corrigée chez Plex, mettez vite votre serveur à jour

20/08/2025 à 10:50

• 14


iOS 26 et macOS Tahoe accueillent l'utilisateur avec une tournée des nouveautés

20/08/2025 à 09:05

• 70


L'IA est là et elle vous aide à lire et à écrire

19/08/2025 à 20:30

• 31


Boulanger propose l’assurance AppleCare+ pour de nombreux produits Apple

19/08/2025 à 17:45

• 16


Mountain Duck 5 se fond dans le Finder et fait du versioning avec le FTP

19/08/2025 à 15:40

• 8