Meta : la deuxième version de LLaMA est open source et utilisable dans un cadre commercial

Félix Cattafesta |

Meta vient de présenter la deuxième grande version de LLaMA, son modèle de langage s'opposant au GPT-4 d'OpenAI. L'entreprise a annoncé la nouvelle à l'occasion d'un événement de Microsoft, précisant que cette dernière était son « partenaire privilégié » pour LLaMA 2. Bonne nouvelle : le modèle sera distribué gratuitement sous une licence permettant une utilisation commerciale.

La stratégie de l'open source est diamétralement opposée à celle d'OpenAI et de Google, qui gardent leurs algorithmes sous clefs. La diffusion d'un LLaMA 2 accessible à tous devrait multiplier les projets basés sur l'IA, et en faire une solution de choix pour les entreprises ne désirant pas payer pour les API de la concurrence.

LLaMA 2 est disponible en trois déclinaisons plus ou moins gourmandes (7B, 13B et 70B) et a été entraîné avec 40% de données en plus par rapport à la première version. Selon Meta, LLaMA 2 est légèrement moins performant que GPT-4 ou PaLM 2, et loin derrière OpenAI en termes de programmation. Un partenariat avec Qualcomm va permettre d'optimiser le modèle pour les téléphones et autres appareils embarquant un SoC de l'entreprise à partir de 2024.

« Nous pensons qu'une approche ouverte est la bonne pour le développement des modèles d'IA d'aujourd'hui, en particulier ceux du secteur génératif où la technologie progresse rapidement », a déclaré Meta. L'entreprise ajoute vouloir mettre le modèle entre les mains de tous, que ce soit celles des grandes boîtes, des entrepreneurs ou des chercheurs. Les « poids » des modèles (les fichiers contenant les valeurs des paramètres des réseaux neuronaux formés) sont téléchargeables, tout comme le code pour le modèle préentraîné ainsi que les versions affinées pour les conversations.

Nous pensons que [l'open source] est plus sûr. Ouvrir l'accès aux modèles d'IA actuels signifie qu'une génération de développeurs et de chercheurs peut les tester en profondeur, identifier et résoudre les problèmes rapidement, en tant que communauté. En voyant comment ces outils sont utilisés par d'autres, nos propres équipes peuvent en tirer des enseignements, améliorer ces outils et corriger les vulnérabilités.

La mise à disposition de ce nouveau modèle a été faite à l'occasion d'un évènement Microsoft. Les deux entreprises disposent d'un partenariat, ce qui fait que Llama 2 est disponible dans le catalogue de modèles Azure AI. Il est également « optimisé » pour fonctionner localement sur Windows. Ce rapprochement avec Meta fait sens pour la firme de Redmond : elle gagne ainsi une longueur d'avance sur son principal rival Google, et peut proposer à ses clients un modèle personnalisable.

Meta mise sur l'open source pour gagner la course à l'IA, ce qui est loin d'être idiot : LLaMA va être à la base de nombreux projets open source et s'imposer dans la communauté libre. L'entreprise pourra regarder comment est optimisée sa création et réutiliser les trouvailles par la suite. De plus, les conditions d'utilisations impliquent que les entreprises dépassant la barre des 700 millions d'utilisateurs actifs devront demander une licence à Meta. Un chiffre très haut qui empêche son utilisation par Amazon ou Google.

IA : Google et OpenAI risquent de rapidement se faire dépasser par la communauté open source, estime un chercheur

IA : Google et OpenAI risquent de rapidement se faire dépasser par la communauté open source, estime un chercheur

Le modèle peut dès à présent être téléchargé via AWS, Hugging Face et d'autres fournisseurs. Cette approche change de la technique utilisée pour la première version de LLaMA : le modèle était accessible sur liste d'attente uniquement pour les chercheurs… mais a fuité sur 4chan en quelques heures.

avatar marc_os | 

son modèle de langage s'opposant au GPT-4 d'OpenAI

S'y oppose-t-il vraiment, ou n'y fait-il pas plutôt concurrence ?

avatar raoolito | 

@marc_os

concurrence non car il est gratuit alors que les deux autres sont payants.
ou alors on peut dire aussi que des entreprises sont en concurrence mais pas des modèles AI

avatar marc_os | 

@ raoolito

> concurrence non car il est gratuit

Le prix de vente n'est pas un critère pour dire si deux acteurs sont en concurrence ou non.

Concurrence :
- Compétition, rivalité d'intérêts entre plusieurs personnes qui poursuivent un même but.
- Structure d'un marché qui se caractérise par une pluralité d'entreprises en compétition les unes par rapport aux autres pour bénéficier de la préférence des consommateurs.
- etc.

avatar raoolito | 

@marc_os

ok dans ce cas les coureurs sur le tour de france ou les athletes des JO sont en concurrence, on dit "s'opposer" car c'est aussi le ca,s presque un synonyme de "concurrence" d'ailleurs...

avatar Paquito06 | 

@marc_os

“concurrence non car il est gratuit alors que les deux autres sont payants.
ou alors on peut dire aussi que des entreprises sont en concurrence mais pas des modèles AI”

Comme dit, concurrence ne signifie pas gratuit/payant. Tu as de la concurrence quand le domaine d’application est le meme et qu’il y a bataille pour des parts de marche (une course au tour de france ou des contrats pour les firmes), la monetisation n’est qu’une option, un moyen d’y parvenir, mais me redefinit pas la concurrence. Elle est pure et parfaite, la concurrence, quand les acteurs s’alignent aur la logique (et donc le business model, payant ou non). Windows (et sa suite office), payant, a tjrs ete un conccurent du monde open source. Ici, les IA sont concurrents, qu’ils soient gratuit ou payant, afin d’offrir un service identique. Le model est different (chatgpt n’est pas evolutif, contrairement a LLAMA 1/2), le modele peut etre payant ou gratuit, osef, et y a bien concurrence.

avatar marc_os | 

@ Paquito06

> @marc_os
> “concurrence non car...

Je n'ai pas écrit cela, c'est raoolito.
(C'est pas moi c'est lui 🤪 - sauf que là on peut vérifier, c'était moins facile à la cour de récré.)

De plus je suis 100% d'accord avec le reste de votre commentaire.

avatar Glop0606 | 

Nous pensons qu'une approche ouverte est la bonne pour le développement des modèles d'IA d'aujourd'hui, en particulier ceux du secteur génératif où la technologie progresse rapidement
Traduction: On est à la bourre, on a la 3ème place, alors on file gratos histoire d'avoir des gens qui nous utilisent et si la sauce devait monter, vous inquiétez pas on saura comment la rentabiliser (Mise à jour module, support, etc... :))

avatar jopaone | 

@Glop0606

C’est pas aussi simple que ça , Meta a toujours eu cette vision open source en IA. Et même si elle ne propose un chatbot comme OpenAI, la firme n’est pas en retard dans la recherche en IA (bien au contraire), la première version de Llama a même eu une grande répercussion dans la communauté.

avatar Glop0606 | 

Tout à fait, on caricature toujours dans les commentaires. Cependant je maintiens que l'Open source est une manière pour Méta de donner de la visibilité à son projet. Pourquoi? Tout simplement car ils n'ont pas encore trouvé le moyen d'incorporé l'IA dans leur produit de façon productive car ils n'ont pas vraiment la plateforme pour ça. Ils cherchent donc en fait une plateforme. Après au niveau purement qualitatif je suis sûr qu'ils font du bon boulot (Même si je n'aime pas Meta, je reconnais que leurs produits marchent très bien.

avatar jopaone | 

@Glop0606

Plateforme à destination des dev tiers peut être , sinon l’IA est très largement utilisée dans les produits de Meta, aujourd’hui Facebook ne pourrait pas fonctionner sans IA (ne serait-ce que pour la modération) c’est une certitude

avatar lepoulpebaleine | 

@jopaone

« Meta a toujours eu cette vision open source en IA »

Tout à fait. N’oublions pas que la bibliothèque open source PyTorch pour le ML et le DL est développée par Meta.

Cela dit Google fait la même chose avec Tensorflow…

avatar 0MiguelAnge0 | 

Microsoft où l’art de se moquer du monde: ils ont remercié chaleureusement hier Meta de proposer leur nouveau modèle en Open Source alors qu’ils refusent d’ouvrir l’algo d’Open Ai…

Bref…

avatar bl@ck warrior_69 | 

@0MiguelAnge0

Microsoft n'est pas propriétaire d'Open AI, ils n'ont aucun droit sur l'algorithme 🤷‍♂️

avatar hptroll | 

« les entreprises dépassant la barre des 700 millions d'utilisateurs actifs devront demander une licence à Meta. Un chiffre très haut qui empêche son utilisation par Amazon ou Google. »
Un chiffre très précis qui correspond au nombre d’utilisateurs de SnapChat, comme le fait remarque John Gruber.
SnapChat est un poil davantage en concurrence frontale avec SnapChat qu’avec Google et Amazon.

CONNEXION UTILISATEUR