Meta présente une nouvelle IA de génération d'images qui promet de révolutionner le secteur

Félix Cattafesta |

Meta a plus d'un tour dans son sac en matière d'IA. En début de semaine, l'entreprise a dévoilé un nouveau modèle de génération d'images qui a la particularité de ne pas fonctionner de la même manière que StableDiffusion, MidJourney ou d’autres services similaires ayant fait grand bruit ces derniers mois. L'idée est de proposer une intelligence artificielle raisonnant d'une manière « semblable aux humains » afin d'obtenir de meilleurs résultats.

Image : Meta.

Meta est parti du constat que les humains absorbent énormément d'informations passivement juste en observant le monde qui les entoure. Ce nouveau modèle I-JEPA (pour Image Joint Embedding Predictive Architecture) va s'inspirer de cela : il utilise ses connaissances du monde extérieur pour compléter les parties manquantes des images. Ce fonctionnement diffère des IA génératives que l'on connait qui vont comparer les pixels pour compléter un cliché. Ici, l'IA va plutôt raisonner et se concentrer sur des représentations abstraites, à la manière des humains.

L'entreprise promet que I-JEPA offre « d'excellentes performances » dans de multiples tâches de vision par ordinateur, et que son modèle est beaucoup plus efficace que les technologies massivement utilisées actuellement. Cette nouvelle approche permet d'éviter certaines erreurs communes sur les IA actuelles, comme les doigts en trop. « Les modèles génératifs appartiennent au passé, nous allons les abandonner pour des architectures prédictives », a expliqué le chercheur Yann LeCun lors d'un événement à Paris auquel à assisté Le Figaro. I-JEPA a également l'avantage d'être plus léger que les larges modèles de langages, et moins coûteux à mettre sur pied.

Le modèle va être partagé de manière open source via un laboratoire de recherche maison. Contrairement à OpenAI, Meta semble parier sur le partage libre de ses technologies et de leur code. Le but avoué est de laisser l'industrie se développer en utilisant ses outils pour ainsi bénéficier des améliorations apportées par la communauté.

Dans la foulée, Meta a également présenté MusicGen, son modèle permettant de créer des musiques à partir de mots. Le concept est semblable au MusicLM de Google, disponible en bêta fermé depuis le mois dernier. Une démo a été mise en ligne, et le code a été mis en ligne sur GitHub.

avatar huexley | 

Ils le proposent en Open comme ca ils se font de la pub gratuitement sachant que ca allait fuiter un jour ou l'autre comme Llama

avatar Paquito06 | 

@huexley

Les papiers de la recherche sur JEPA sont dispo a Cornell depuis 6 mois: https://arxiv.org/abs/2301.08243

avatar CtrlMaster | 

Je suis pour une régulation massive de ces outils, mais j’ai peur que cela provoque un ralentissement de l’innovation en Europe…

avatar Sindanarie | 
avatar oomu | 

@CtrlMaster

et alors ?

Il y a quoi de mal à "ralentir" ?

il nous faut de toute façon ralentir:
- le temps que les gens (moi et le reste de l'humanité sauf vous) se mettent à niveau
- le temps d'avoir assez d'énergie
- le temps de travailler sur tous les autres sujets que l'humanité doit gérer (c'est à dire _tout_ )
- le temps de préparer le cadre juridique et les assurances
- le temps que petit Billy se remette de son accident de ski

etc.

BREF , il n'y a aucun problème. et c'est l'histoire de l'humanité que de réguler et digérer des nouveaux techniques. Vous y survivrez aussi au "ralentissement de l'innovation en europe bouhouhouh on va tous crever"

avatar leinuo88 | 

@oomu
Si tout le monde ralenti, c’est pas forcément un problème.
Mais si tout le monde avancent de plus en plus vite et que toi seul tu ralentis, tu te fait totallement dépasser et tu deviens un vassal de ces pays avancés car tu n’es plus compétitif.

Imagine un pays qui utilise encore des usine du style XIXieme siècle au XXIieme siècle… car il aurait décidé de ralentir quand nous non… ben ce pays serait “dans la merde”.

avatar vicento | 

@oomu

La sagesse du Grand Oomu est légendaire 😃

Malheureusement les grands conseillers de nos dirigeants ne sont pas forcément aussi éclairés.
On se demande même parfois (constamment ?) si ils ne travaillent pas consciemment contre les intérêts de la zone Europe ….

avatar CtrlMaster | 

@oomu

Je parlais d’une innovation à doubles vitesse, où l’Europe s’était contrainte de respecter un éthique imposée par l’UE, et où les US risquerait de devenir encore plus le far west

avatar oomu | 

@CtrlMaster

inutile aussi d'être "massif"

on peut être raisonnable et précis.

avatar vicento | 

@CtrlMaster

Sans decooooonnnneeer 🤓

avatar CtrlMaster | 

@vicento

🥱

avatar iPop | 

@CtrlMaster

Au contraire ça va le décupler mais en retour on risque d’être de plus en plus idiot. L’IA va pouvoir tester des milliard de combinaisons, composer des molécules, leur attribuées des capacités, etc..c’est une évidence, tout comme l’a été avec l’arithmétique mais qui a atteint ses limites. L’homme pourra toujours influencer sur le processus mais la machine ira plus vite et les sociétés vont investir et s’emparer de ça.

Le souci c’est que la recherche risque de disparaître.

avatar CtrlMaster | 

@iPop

Je parlais d’une innovation à doubles vitesse, où l’Europe s’était contrainte de respecter un éthique imposée par l’UE, et où les US risquerait de devenir encore plus le far west

avatar Sindanarie | 

Semblable aux humains ?
Mais Zuckerberg et son équipe ne sont pas humains 😂

avatar Tomtomrider | 

@Sindanarie

Monsieur LeCun est très bien!

avatar oomu | 

@Sindanarie

il fut humain, car il avait des émotions humaines quand il était humains, je veux dire, il est humain, mais il parlait de avant.

ho et il a déjà répondu lors d'un entretien sur reddit: il n'est pas un reptilien

alors hein? bon :)

avatar DahuLArthropode | 

@oomu

Mais si j’étais un reptilien, c’est exactement ce que je dirais.

avatar Sindanarie | 

@DahuLArthropode

L’oomu n’est pas reptilien, c’est une ancienne divinité précolombienne retraitée

avatar ratz | 

quand pourra t on le tester , pour le commun des mortels ?

avatar fleeBubl | 

@ratz

En vrai ? Quand on arrêtera de combler les trous 🕳️ 🕳️ 🕳️ avec n’importe quoi. On pourra repenser à la manière dont le regard 👀 focalise sur des zones sans trop les regarder en détail, pour les reconstituer dans un contexte, que l’œil perçoit avec beaucoup plus de rapidité et d’agilité. Et qu’avec la facilité de recomposer ce à quoi on s’attend (parce que c’est vraiment le cas ;) ça vaut pas le coup de s’y attarder, trop… genre : ce planter sur des pixels au point de rajouter un sixième doigt (par exemple : c’est juste une main 🤚🏼 une main 🖐️ youhou… ). Tout ça vaux aussi, si il faut s’attendre à un peut trop, trouver les choses absolument tranchées. En vrai, c’est plutôt des zones un peu plus… spéciales, avec beaucoup de variations, sur lesquelles il faut passer plus de temps à distinguer de quoi il est question… même si ça reste un peu flou, au final… ou un peu dissimulé : genre, un papillon qui se réchauffe pour reprendre son vol, les ailes écartées, au milieu des feuilles. De toute façon, pour en être sûr, il faudrait se rapprocher au risque qu’il referme les ailes et qu’on ne distingue plus l’essentiel (ou bien avoir une Fotôt avec tellement plus de zoom juste sur cette zone… 🫣)
Bah, c’est juste qu’une IA (temporairement). C’est jamais qu’un outil (en attendant le prochain : après la roue, les jambes)

avatar Adodane | 

@fleeBubl

Ok.

avatar jackhal | 

D'après l'exemple, c'est vraiment excellent, on dirait vraiment voir Mark Zuckerberg s'adresser à une audience !

avatar cosmoboy34 | 

@jackhal

🤣

avatar stefhan | 

@jackhal

😁

avatar cosmoboy34 | 

Ce qui m’intrigue c’est l’intérêt financier pour Meta qui est pas clair. Ils ont pas dépensé des millions par philanthropie.

avatar oomu | 

@cosmoboy34

ben non

brevet, fonctionnalités dérivées (qui seront elles très propriétaires), etc.

avatar cosmoboy34 | 

@oomu

Brevet ? C’est open source
Produits dérivés ? Ça remboursera le coût de développement de ces produits pas de ce qui est présenté la.

avatar cosmoboy34 | 

@oomu

En fait meta entant meta j’ai bien peur qu’on découvre un jour la vraie raison de rendre ces outils open source et qu’on ne l’aime pas beaucoup 😅

avatar vidok91 | 

@cosmoboy34

Je me pose la même question, il se peut que les IA n’étant “que” des algorithmes, elles finiront toujours par être copiées par la concurrence…

Du coup, autant récolter un peu de boost réputationel avec une annonce qui replace Meta “dans le game” alors que le Métavers semble être retombé comme un soufflé.

avatar vicento | 

@vidok91

Un soufflet qui avait déjà du mal à monter !!!

avatar Kounkountchek | 

@cosmoboy34

React, Jest, Docusaurus, PyTorch…
(Et il y en a bien d’autres)
Autant d’outils de développement créés chez Facebook/Meta et qu’ils ont mis en open source.

avatar Terragon | 

En tout cas, plus de chance que ce soit rentable que son univers virtuel…

avatar XiliX | 

"Meta est parti du constat que les humains absorbent énormément d'informations passivement juste en observant le monde qui les entoure."

Il parle pour lui et son équipe

avatar ⚜Dan | 

A chaque fois qu’il parle d’un truc on le vois jamais lol

avatar properso | 

pas de lien pour tester ?

avatar PtitXav | 

Pour le nom ça ressemble pas mal a «j’ai pas». C’est ce que dira l’IA quand la question est trop compliquée ?

avatar Krocell | 

Des promesses, toujours des promesses

CONNEXION UTILISATEUR