Dolly 2.0, un modèle de langage open source utilisable à des fins commerciales

Félix Cattafesta |

La course aux modèles de langage est lancée, et les projets open source se multiplient. Meta a ouvert le bal en présentant LLaMA, un modèle qui devait rester réservé aux chercheurs, mais qui a rapidement fuité en ligne. Aujourd'hui, l'entreprise Databricks vient d'annoncer Dolly 2.0, un modèle open source publié sous une licence qui autorise un usage commercial. Les développeurs et entreprises vont donc pouvoir s'en servir gratuitement dans leurs différents projets.

Dolly 2.0 est un modèle de langage de 12 milliards de paramètres, dont Databricks affirme qu'il a été affiné (« fine-tuned ») exclusivement sur un « ensemble de données de haute qualité ». Ce procédé lui permet de se rapprocher de ChatGPT étant donné qu'il est optimisé pour les dialogues et la réponse aux questions, contrairement à d'autres modèles plus bruts comme celui de Meta. À l’inverse à ce que propose OpenAI, le modèle est entièrement open source et est disponible sur Hugging Face et GitHub.

Par le passé, Databricks a présenté une première version de Dolly qui était elle aussi open source. Cependant, celle-ci utilisait une base de données avec du contenu d'OpenAI, ce qui allait à l'encontre de ses conditions d'utilisation. Pour Dolly 2.0, l'entreprise a fait appel à des milliers de ses employés pour mettre au point un ensemble d'apprentissage et peut donc diffuser gratuitement son projet sans contraintes. Databricks espère ainsi attirer de nouveaux clients, construisant leurs apps basées sur Dolly 2.0 via sa plateforme.

Ce modèle de langage n'est pas forcément le plus précis dans ses réponses. Techcrunch a pu l'essayer et rapporte que celui-ci a fait des erreurs grossières ou peut affirmer des choses fausses. C'est le cas de tous, mais il semble que Dolly 2.0 ne soit pas dans le haut du panier de ce côté-là. Le CEO de Databricks se défend en expliquant que son produit vise plutôt des utilisations simples, comme la réponse à des tickets pour les SAV, le résumé de documents ou la génération de code. Le modèle n'a pas accès à internet, ce qui limite ses connaissances.

Cette nouveauté pourrait tout de même avoir un impact fort dans différents secteurs. Les développeurs sont très intéressés par les IA du style ChatGPT, mais doivent actuellement passer par les API payantes d'OpenAI. Le modèle open source de Meta ne peut pas être utilisé dans un cadre commercial, ce qui ne laisse pas beaucoup de choix. Avec Dolly 2.0, ils ont désormais une nouvelle alternative gratuite ne nécessitant pas de partager les données de leurs utilisateurs.

avatar pb23 | 

Je n’ai pas compris leur modèle économique 🤷🏻‍♀️

avatar redchou | 

@pb23

Il propose le modèle gratuitement, et dans le même temps, ils vendent des solutions clef en main pour l’utiliser je pense…

avatar marc_os | 

@ pb23

> Je n’ai pas compris leur modèle économique

Un grand classique pratiqué par exemple par Microsoft aux débuts d'Internet.
- il y existe des navigateurs payants
- je développe un navigateur. (Internet Explorer)
- Il est en retard du point de vue technique.
- je le rend gratuit.
- les gens commencent à l'utilise parce que c'est gratuit.
- les concurrents ne vendent plus leur navigateur (Netscape)
- je reste quasi seul sur le marché
- une fois que je n'ai plus vraiment de concurrence, je peux faire ce que je veux.
Dans le cas de Microsoft / IE, Microsoft gagnait de l'argent via Windows etc.
Pour une entreprise qui n'a pas d'autre produit, une fois en position de force avec une clientèle captive, elle peut rendre des parties payantes, et de plus en plus au fil du temps.
On verra ce qu'il adviendra de Dolly*.
En attendant, dans le monde de la "high tech", on peut vivre longtemps en faisant des pertes abyssales...
 
 
(*)Le petit nom de la voiture de ma grand mère à l'époque !

avatar mauy | 

Databricks propose des solutions de type "data lake" pour tout ce qui touche à la gestion du "big data" et des modèles IA qui en tirent parti. J'imagine que leur but est de vendre ces solutions autour de cela en proposant un modèle comme Dolly 2.0 gratuit qui peut en bénéficier.

avatar matalbal | 

@marc_os

avatar cosmoboy34 | 

@pb23

Je me posais la même question. Développer une ia ça coûte une fortune

avatar jopaone | 

@cosmoboy34

En rendant les modèles d'IA open source, les grandes entreprises technologiques (Meta, Google, MS …) encouragent la collaboration entre chercheurs et développeurs. Ça conduit généralement à une innovation plus rapide et à l'amélioration des modèles grâce à la contribution de la communauté (ça permet aussi de détecter plus efficacement les problèmes ou les biais). Et surtout si le modèle est intéressant , ça renforce l’image de la boîte qui est davantage crédible pour s’imposer comme leader (ou futur leader) dans le domaine.

avatar cosmoboy34 | 

@jopaone

Quand c’est une boîte qui a d’autres moyens très lucratifs de subsistance oui ici c’est différent

avatar pb23 | 

@cosmoboy34

Dans le podcast, macge disait que ce n’est pas si cher en termes d’investissements

avatar cosmoboy34 | 

@pb23

Ah oui ? J’aurais plutôt pensé le contraire rien que niveau main d’œuvre

avatar pb23 | 

@cosmoboy34

Oui enfin la main d’œuvre c’est le lumpen prolétariat du web… 🥴

avatar marc_os | 

@ pb23

> Dans le podcast, macge disait que ce n’est pas si cher en termes d’investissements

Euh... je n'ai pas entendu le podcast, mais je doute que l'utilisation des serveurs soit "pas si chère".
D'une part ils utilisent des centaines ou des milliers de "cartes graphiques" parmi les performantes et les plus chères pour calculer dans les 100 millions de paramètres, de plus les entrainements durent des mois.
Enfin partout je lis des choses du genre:
« Les serveurs qui alimentent ChatGPT sont très onéreux à exploiter et OpenAI semble avoir mis des limites à leur utilisation suite à l’incroyable explosion de l’intérêt ».

CONNEXION UTILISATEUR