Ferret, le nouveau modèle d’intelligence artificielle multimodal d’Apple

Félix Cattafesta

mardi 02 janvier 2024 à 14:48 • 45

Si Apple reste bien discrète dans la grande course à l’IA qui secoue toute l’industrie depuis 1 an, Cupertino continue d’affuter ses armes. Sans tambour ni trompette, l’entreprise a mis en ligne un nouveau modèle de langage baptisé Ferret au mois d’octobre. Celui-ci a pour particularité d’être multimodal, et donc de mélanger textes et images.

La démo de Ferret, disponible sur Github. L’IA a réussi à effectuer l’observation suivante : « L'objet (obj0) est un chien et l'objet (obj1) est un furet. Le chien et le furet semblent être assis ensemble dans la neige, ce qui suggère une interaction amicale ou de la camaraderie. »

Ce modèle peut déterminer les éléments composant une image, les délimiter et les identifier pour qu’ils puissent être utilisés dans une requête. Plusieurs utilisations sont possibles : l’utilisateur pourra par exemple mettre en valeur un animal sur une image, et Ferret lui indiquera de quelle espèce il s’agit. Il a la capacité de séparer un élément du reste d’un groupe, et de préciser le contexte d’une photo.

Le chercheur d’Apple Zhe Gan affirme que le modèle « montre souvent une meilleure compréhension précise des petites régions de l'image » que GPT-4V, le modèle spécialisé d’OpenAI. Deux versions ont été publiées, une avec 7 milliards de paramètres et une seconde avec 13 milliards. Apple indique que son modèle a été entraîné sur 8 GPU NVDIA A100 avec 80 Go de mémoire. Ferret est open source, même si sa mise à disposition se fait sous licence non commerciale (il ne peut pas être commercialisé en l’état).

Ce type de technologie pourrait sans problème trouver son utilité au sein de l’app Photos d’Apple en améliorant la recherche d’images. Elle pourrait également servir à un éventuel AppleGPT, qui serait en développement à Cupertino selon les rumeurs. Aux dernières nouvelles, Apple aurait prévu de mettre le paquet sur l’intelligence artificielle dans ses prochains systèmes d’exploitation et dépenserait sans compter pour percer dans le domaine.

La Pomme a récemment publié deux travaux de recherche liés à l’IA. Le premier concerne une technique permettant d’utiliser la mémoire flash d’un appareil pour faire tourner un large modèle de langage (LLM), tandis que le second est utilisé pour créer un avatar 3D à partir de quelques secondes de vidéo d’un individu en mouvement. Apple expérimente également avec les outils de génération d’images dans le style de DALL-E ou de Midjourney.

Source :

Image d’accroche : Dall-E 3.

Pour aller plus loin :

Soutenez MacGeneration sur Tipeee

MacGeneration

iGeneration

WatchGeneration

Services

Rejoignez le Club iGen

Ferret, le nouveau modèle d’intelligence artificielle multimodal d’Apple

Pour aller plus loin :

MacGeneration a besoin de vous

Actualités

Apple perd encore un ingénieur IA qui fuit chez Meta

L’US Mint a révélé la pièce à l’effigie de Steve Jobs qui sera frappée en 2026

Chine : Tim Cook réaffirme vouloir investir en Chine, au risque de déplaire à la Maison Blanche

Les investissements dans les data-centers toujours plus nombreux pour faire face à la montée de l’IA

Apple réduit ses prix sur de nombreux produits, dont des classiques comme le MacBook Air ou les iPad

Votre Mac mérite une connexion sans frontières : le VPN CyberGhost est en promo flash ! 📍

Apple rabote le prix des iPad : -100 € sur les iPad Pro, entre -50 € et -100 € sur l’iPad Air, l’iPad à partir de 389 €

Apple M5 : Apple muscle son jeu dans la continuité

Le MacBook Pro M5 ouvre l’ère des Mac portables sans chargeur 🆕

Le Mac Studio revient à son prix d’origine : à partir de 2 299 €, soit 200 € de moins

Apple baisse les prix des MacBook Air M4 : à partir de 1 099 €, 100 € de moins que ce matin

Apple lance l’iPad Pro M5 et promet de grandes avancées en matière d’IA

Apple annonce le Vision Pro M5 : plus de puissance et de confort pour 300 € de moins

Apple annonce un nouveau MacBook Pro avec puce M5 à partir de 1 799 €

Une licence Microsoft Office 2021 pour Mac à moins de 50 € ? C'est possible ! 📍

Les taxis autonomes de Waymo arriveront à Londres en 2026

Image du moment

Tests

Test de la souris MX Master 4 de Logitech : une souris qui nous fait vibrer ?

Test du Ugreen DXP480T Plus : le NAS (à quatre SSD) qui se détache de la masse

Test de deux stations d’accueil pour Mac mini M4, pour retrouver l’USB-A et plus encore

Test de l’écran PA32QCV d'Asus : une alternative abordable au Pro Display XDR ?

Test du « superchargeur » Genki Moonbase : la multiprise qui balance des ports

Test du Razer Joro : un clavier compact plus tourné vers le PC que vers le Mac