Ouvrir le menu principal

MacGeneration

Recherche

MM1 : le modèle d’IA multimodal d’Apple très doué pour l’analyse d’images

Félix Cattafesta

Tuesday 26 March 2024 à 11:30 • 34

AAPL

Apple continue de distiller ses efforts dans le domaine de l’IA à travers différents papiers de recherche. Après Ferret ou MGIE, l’entreprise a récemment levé le voile sur MM1, un nouveau modèle multimodal pouvant travailler avec du texte et de l’image.

Résultats obtenus par MM1.

MM1 peut répondre à des demandes naturelles pouvant porter sur des photos. Le papier de recherche donne un exemple où on lui montre un cliché représentant une table sur laquelle sont posées plusieurs bouteilles de bière avant de lui montrer un menu de restaurant. On lui demande ensuite combien il faut s’attendre à payer pour tout cela, ce à quoi le modèle répond correctement. On peut aussi voir MM1 décrire l’ambiance d’une image de manière détaillée, ou effectuer différentes déductions logiques. Le modèle est également sollicité pour aider à utiliser une machine à café, et se débrouille bien pour répondre à plusieurs requêtes à la suite.

Ce type de modèle est similaire sur certains points au Llama de Meta ou au Gemini de Google. Il peut servir à alimenter un chatbot général ou plus spécifique, par exemple en effectuant des actions. On peut imaginer que la nouveauté finira par trouver sa place dans l’écosystème Apple, comme pour décrire des photos ou des documents. Ce type de technologie ouvre notamment de nombreuses portes dans le domaine de l’accessibilité.

Be My AI : quand GPT-4 décrit fidèlement l

Be My AI : quand GPT-4 décrit fidèlement l'environnement des personnes aveugles

Un extrait du document de recherche.

Le modèle est composé d’une famille de différentes tailles, globalement assez petit si l’on se fie à leur nombre des paramètres. Les chercheurs expliquent obtenir tout de même de bons résultats grâce à un gros travail d’optimisation. Le but est sans doute de le faire tourner en local sans passer par le nuage, ce qui est un bon point niveau confidentialité. Cela demande cependant pas mal de puissance sous le capot : il semblerait qu’Apple envisage des déclinaisons mettant le paquet sur l’IA pour ses prochaines puces de smartphone.

Source : Accroche : Copilot.

Rejoignez le Club iGen

Soutenez le travail d'une rédaction indépendante.

Rejoignez la plus grande communauté Apple francophone !

S'abonner

Un iPhone 16 Pro Max déjà vendu sur eBay, qu'il ne fallait surtout pas perdre dans un bar ou tester avec Geekbench

12:30

• 8


Craig Federighi empAIe son chien avec Image Playground

10:45

• 25


Les AirPods 4 n'ont plus de bouton visible

10:44


Le générateur de vidéos par IA d’Adobe sera lancé d’ici la fin de l’année

07:00

• 20


UPDF : jusqu'à 50 % de réduction et un iPhone 16 à gagner !!

Partenaire


Boulanger, Cultura et d’autres sites victimes de fuites de données

11/09/2024 à 21:17

• 37


Huit nouveaux emojis, des hiéroglyphes et des jeux vidéo dans Unicode 16.0

11/09/2024 à 19:30

• 7


Commandez dès maintenant votre coque pour iPhone 16 📍

11/09/2024 à 16:11


Free met à jour ses Freebox et répéteurs Wi-Fi 7 pour des soucis en 2,4 GHz

11/09/2024 à 15:45

• 12


Starlink passe de 59 à 72 € mensuels en mobilité, mais en couverture mondiale

11/09/2024 à 14:30

• 5


Back to School : les AirPods 4 maintenant offerts pour l’achat d’un Mac

11/09/2024 à 12:30

• 3


Puces A18 et A18 Pro : Apple abandonne le Bionic et livre un A18 qui ressemble à un A17

11/09/2024 à 11:14


Tesla ne promet plus la conduite entièrement autonome pour les nouveaux clients américains

11/09/2024 à 10:04

• 55


Le MagSafe double le Qi2 pour la recharge sans fil des iPhone 16

10/09/2024 à 20:44


La PlayStation 5 Pro s'approche du prix d'un iPhone 16 : 920 € avec le lecteur de disques

10/09/2024 à 18:53

• 142


Europe : l'amende de 2,4 milliards pour Google Shopping est confirmée

10/09/2024 à 18:30

• 35