Mozilla lance un "Firefox" des intelligences artificielles

Florian Innocente |

Mozilla veut faire pour l'intelligence artificielle ce qu'elle a fait avec Firefox pour les navigateurs web. Offrir une alternative open source aux solutions créées par des sociétés et grands groupes privés.

Depuis quelques années, la fondation Mozilla creuse le sujet de la place de l'intelligence artificielle dans notre société et notre environnement technologique. Des centaines de chercheurs, de développeurs, d'enseignants, d'artistes et d'autres profils pouvant apporter une contribution à ce débat ont été sollicités.

L'actualité de ce domaine s'est soudainement emballée ces derniers mois avec OpenAI, son ChatGPT et d'autres outils capables de générer des textes et des images à la demande. Ces techniques sont sorties de la sphère des initiés pour s'ouvrir auprès du grand public.

« Cette nouvelle vague d'IA a suscité de l'excitation, mais aussi une forte appréhension » observe Mark Surman, le directeur exécutif de Mozilla, avant de rappeler les enjeux : « Deux décennies de médias sociaux, de smartphones et de leurs conséquences nous ont rendus méfiants ».

Ces nouveaux outils vont rapidement dépasser le stade de la simple curiosité. Ils s'intègrent déjà au sein d'applications utilisées quotidiennement jusque dans les entreprises.

Adobe Firefly : une intelligence artificielle pour les créatifs de l

Adobe Firefly : une intelligence artificielle pour les créatifs de l'image

Microsoft 365 prend un Copilot basé sur GPT-4

Microsoft 365 prend un Copilot basé sur GPT-4

Microsoft l'a fait avec Edge et s'y prépare activement pour sa suite Office, Adobe n'est pas en reste avec son Creative Cloud, ni Opera avec son navigateur et des dizaines d'apps ont vu le jour sur les stores d'Apple et de Google. Petits ou grands, sérieux ou pas, quantité d'éditeurs ont embrassé ces intelligences à (très) grande vitesse.

Google lance prudemment une première « expérimentation » pour Bard

Google lance prudemment une première « expérimentation » pour Bard

Mozilla s'inquiète dès lors de voir de grands groupes privés monopoliser ces nouveaux outils, comme ils l'ont déjà fait avec d'autres pans d'internet, grâce à leur poids et leurs ressources techniques et financières. Ces intelligences artificielles ont besoin d'imposantes capacités de calcul et d'investissements tout aussi conséquents pour fonctionner et être mises à disposition :

Les géants de la technologie déploient rapidement des services dans le nuage conçus pour verrouiller le marché des infrastructures dont les startups et les entreprises auront besoin pour utiliser ces nouveaux outils. S'ils y parviennent, changer les règles du jeu sera presque impossible — et les problèmes que nous rencontrons aujourd'hui avec internet risquent de s'aggraver.

En réponse, la fondation Mozilla a annoncé la création de Mozilla.ai, à la fois une startup et une communauté, ainsi qu'un premier investissement de 30 millions de dollars pour la mettre sur les rails. Elle sera dirigée par Moez Draief, un universitaire spécialiste du domaine, passé par les unités de recherche de Huawei et de Capgemini.

Son objectif sera de créer un écosystème open source et digne de confiance dans ce champ des intelligences artificielles génératives. À la centralisation des moyens, Mozilla oppose la décentralisation et la transparence sur les technologies utilisées. Elle veut faire participer le plus d'acteurs possible, les gouvernements, le secteur public et aménager une (petite) place également à ces grands acteurs du privé s'ils le souhaitent.

L'une des premières missions de Mozilla.ai sera de concevoir des outils qui ajouteront une « couche de confiance » par-dessus les grands modèles de langages exploités par l'intelligence artificielle générative. Afin de prévenir l'utilisateur lorsque ces assistants s'égarent dans les contenus qu'ils retournent ou lorsqu'ils se mettent à en créer de toute pièce.

D'autres projets seront annoncés dans un second temps ainsi que des partenaires pour accompagner cette initiative.

avatar joneskind | 

Même si je n’utilise pas leur navigateur, je trouve que la fondation Mozilla fait partie des rares entreprises de confiance pour traiter le délicat sujet des ChatAI.

J’attends vraiment beaucoup de leur part, et j’espère qu’ils sauront mettre de l’ordre dans le shitshow de désinformation produit par les IA d’OpenAI, Bing et Google.

J’espère notamment pouvoir distinguer dans les réponses les sources factuelles des sources d’opinion, ou bien encore avoir un score d’acuité.

avatar Scooby-Doo | 

@joneskind,

« J’espère notamment pouvoir distinguer dans les réponses les sources factuelles des sources d’opinion, ou bien encore avoir un score d’acuité. »

C'est très bien ce que vous dites ! Et je suis d'accord avec vous sur le principe ! Un score d'acuité !

Problèmes :

1. Avez-vous utilisé ChatGPT ou Bing Prométhée pendant des mois et qu'est-ce que vous en pensez ?

2. Pour ma part, j'ai pu remarquer une grande qualité rédactionnelle ! Ces générateurs produisent du texte en Français dans mon cas avec très peu de fautes de Français, de syntaxes ou de styles. Sur ce point c'est bluffant d'efficacité ! L'acuité rédactionnelle est donc excellente !

3. Les sources ne sont pas fournies avec ChatGPT, donc on ne sait sur quoi il se base pour répondre ! Du coup, j'ai été obligé de faire des recherches sur ses affirmations parfois confirmées par certaines sources, parfois par aucune ou alors je n'ai pas réussi à les trouver !

4. Bing Prométhée fournit ses sources et mêmes les liens interactifs qui renvoient vers les documents utilisés pour construire sa réponse ! Pour le coup, j'ai pu vérifier les sources et en règle générale ses réponses sont correctes mais ils restent des réponses erronées ou mal construites !

5. Sur Bing, j'ai compris qu'il utilisait un grand panel de sources, de Wikipédia aux sites d'informations aux sites gouvernementaux jusqu'à Marie-Claire pour caricaturer ! Du coup, quand pour une question posée on peut avoir plusieurs réponses, comment fait-il un arbitrage ? C'est aussi mystérieux que le système de ranking de Google : une boîte noire !

6. Ces IA utilisent des sources supposées fiables ! Un site gouvernemental peut être considéré comme fiable si on cherche un article de loi ou un règlement par exemple ! Mais quand cela concerne le savoir, quel site est fiable ? J'ai déjà rapporté sur ce forum des exemples de contradictions importantes au sein même de Wikipédia en fonction de la langue !

Exemple : qui a conçu le premier sous-marin et à quelle date ? Selon Wikipédia FR, ce sera untel à une date ; selon Wikipédia EN, ce sera une autre personne à une autre date ! Et ce n'est qu'un exemple parmi des milliers que l'on peut constater tous les jours sur Wikipédia ! Quasiment tous les articles multilingues, la majorité, sont touchés par ce problème de contradictions inter-langues ! Cette encyclopédie vivante n'est pas une encyclopédie au sens premier du terme !

Les encyclopédistes faisaient un travail d'unification de l'état du savoir, par exemple l'encyclopédie Diderot éditée de 1751 à 1772. Il a effectué un travail d'arbitrage pour lever certaines contradictions constatées lors de son élaboration. Wikipédia ne le fait pas et surtout comme c'est un travail collectif multi-langues, chaque nationalité a à cœur de mettre en avant ses scientifiques, ses découvreurs et grands esprits ! Le tout est le contraire même d'une encyclopédie unilingue qui tente de faire un état des lieux du savoir à un instant, généralement sa date de première édition, avec des addendum rectificatifs pour les éditions suivantes.

Du coup Wikipédia devrait être :

- soit exclu des sources de ces IA qui effectuent des arbitrages automatiques dans une boîte noire, avec les résultats farfelus que tout un chacun peut constater par soi-même et c'est vraiment inquiétant ;

- soit inclu avec l'accord et la collaboration de Wikipédia pour lever toutes les contradictions, article par article, langue par langue, pour donner une base stable à ces IA, quitte à ce que ce service soit rémunéré ou financé.

7. Vient ensuite le problème des sources d'informations continues qui est à l'opposé du travail de l'encyclopédiste qui fige le savoir pour éviter toutes contradictions, quitte à se contredire pour la prochaine édition.

Les sources d'informations continues sont principalement de deux types :

- les communiqués de presse type AFP, Reuters, etc., qui sont en général plutôt neutres ;

- la presse avec ses biais en fonction du bord politique revendiqué ou non, sa proximité avec un courant d'opinions.

Par exemple un même communiqué de presse pourra être interprété différemment par un hebdomadaire pro écologistes et un autre pro entreprises ! La première source d'informations continues peut alimenter ces IA sans engager la neutralité espérée de l'IA ; La deuxième source d'informations continues peut aussi alimenter ces IA mais il faut que dans la réponse soit mentionnée cette source qui peut comporter un biais politique, idéologique, etc.

Exemple de réponse : Selon la BBC, ce décret aura telles conséquences... et selon Sky news, ce décret aura d'autres conséquences… !

Parce que faire des raccourcis, des compilations, à partir de données factuellement exactes individuellement, peuvent produire une fake news parfaitement construite !

👌

avatar joneskind | 

@Scooby-Doo

1. Avez-vous utilisé ChatGPT ou Bing Prométhée pendant des mois et qu'est-ce que vous en pensez ?

J'utilise ChatGPT pratiquement depuis sa sortie. L'entreprise pour laquelle je travaille nous encourage à l'utiliser autant que possible. C'est incroyable tant qu'il ne se trompe pas. Généralement il est plutôt doué pour aider à rédiger des documentations, au moins dans la forme. Sa manière de "parler" est irréprochable. Le problème c'est le fond, parce qu'il est capable de répéter n'importe quoi avec un aplomb d'homme politique. C'est pour ça qu'il lui faut impérativement donner ses sources.

4. Bing Prométhée fournit ses sources et mêmes les liens interactifs qui renvoient vers les documents utilisés pour construire sa réponse !

Sur ce point Bing est plus "fiable" dans le sens où on peut vérifier ses sources, mais ce n'est pas encore suffisant.

Du coup, quand pour une question posée on peut avoir plusieurs réponses, comment fait-il un arbitrage ?

C'est exactement le problème. Il ne comprend pas ce qu'il écrit, donc il est incapable de faire un arbitrage. D'ailleurs je préfèrerais qu'il n'en fasse pas pour certains sujets d'actualités.

Par exemple si je lui demande de m'en dire plus sur la dernière "affaire" en cours j'aimerais qu'il me réponde en me donnant:
- Les faits bruts rapportés par les instances officielles avant toute chose. Y compris les informations contradictoires genre "3000 manifestants selon la police, 300000 selon les organisateurs" etc.
- Une interprétation générale de la presse conservatrice et ses sources
- Une interprétation générale de la presse libérale et ses sources
par qu'une presse objective ça n'existe pas.

Votre point 7 résume plutôt bien cette idée ^-^

@macg Vous pourriez pas ajouter la balise <blockquote> dans les commentaires ?

avatar Scooby-Doo | 

@joneskind,

Merci pour vos réponses !

Désolé pour mon pavé mais je ne voulais pas jouer la simplicité surtout à vos questions totalement légitimes !

Je fais le même constat que vous !

La fonction créative est bluffante ! La génération de textes est vraiment très bonne. Le niveau de qualité de son Français est quasi irréprochable.

Par contre dès qu'on fait appel à son « intelligence comparative », ben c'est très aléatoire ; pareil pour résumer un texte ou résoudre des problèmes mathématiques de base. Je parle d'arithmétique !

En gros, une IA littéraire parfaitement illogique, nulle en maths et taillée pour une carrière politique tellement elle peut affirmer n'importe quoi avec un aplomb insolent !

Mais elle est d'agréable compagnie, aime blaguer et résoudre des devinettes. On peut aussi discuter nourriture et recettes de cuisine. Cette IA aime énormément la bonne chaire !

Je me suis pris aussi la tête avec elle sur la matière sombre.

👌

avatar vince29 | 

>On peut aussi discuter nourriture [...] Cette IA aime énormément la bonne chaire !
>
>Je me suis pris aussi la tête avec elle sur la matière sombre.

La chaire d'astrophysique donc.

avatar Scooby-Doo | 

@vince29,

« La chaire d'astrophysique donc. »

Excellente synthèse ! Nappée avec de la crème fraîche ! Je vois que vous avez lu mon jeu de mots !

😁

avatar unixorn | 

> L'une des premières missions de Mozilla.ai sera de concevoir des outils qui ajouteront une « couche de confiance » par-dessus les grands modèles de langages

Je résume : 30 millions sur la table pour rajouter une surcouche dont personne ne veut sur des modèles qu'ils n'ont pas. Du grand Mozilla comme d'habitude.

avatar noooty | 

@unixorn

Tu m’as bien l’air d’en connaître un max…
😂

avatar vincentn | 

@unixorn

🙄

Vous préférez probablement des duopoles (allez, on va dire trois-quatre), uniquement américains pour l’Occident, qui verrouillent ce marché en « gérant » toute la partie éthique de ces outils et technologies en mode yolo.

Pour ma part, non.

Bref, bonne initiative de la fondation Mozilla. Espérons juste que les forces en présence du côté du monde de l’OpenSource, développeurs, usagers, régulateurs… s’accordent et ne jouent pas leur propre partition dans leur coin.
Sinon on part pour encore 25 ans de domination de certaines sociétés et de tous les problèmes que nous connaissons actuellement, mais en pire.

avatar zoubi2 | 

@unixorn

Merci de ce commentaire précis et argumenté. 😟😟😟

avatar Scooby-Doo | 

@zoubi2,

« Merci de ce commentaire précis et argumenté. »

Cherchez pas, c'est peut-être juste un troll aigri !

😁

avatar Scooby-Doo | 

@unixorn,

« Je résume : 30 millions sur la table pour rajouter une surcouche dont personne ne veut sur des modèles qu'ils n'ont pas. Du grand Mozilla comme d'habitude. »

Le problème n'est pas l'IA en elle même mais ses sources d'informations : son dataset !

Et comme ces IA utilisent Wikipédia l'encyclopédie totalement schizophrénique, ces IA sont schizophréniques aussi !

En plus, ces IA effectuent des arbitrages automatisés du même niveau d'obscurité que l'algorithme de Google pour calculer le ranking d'une page !

En moyenne, Google trouve des millions de liens, et il classe ces liens en pages de résultats !

Les mots clefs sont la question et les pages de liens les millions de réponses.

Pourtant personne ne remet en cause cela alors que c'est totalement opaque !

Étrange n'est-ce pas ?

👌

avatar occam | 

@unixorn

~(A^B) « pour rajouter une surcouche dont personne ne veut sur des modèles qu'ils n'ont pas »

Un jour, vous apprendrez à ne pas énoncer des propositions composites dont chaque élément est démonstrablement faux.

A. « une surcouche dont personne ne veut » : trop facile, où est le fun ?
Il suffit de démontrer qu’il existe au moins une entité qui infirme cette généralisation. Or, je veux bien d’une telle surcouche. Ce qui suffit.

B. « des modèles qu'ils n'ont pas » : ça, c’est plus rigolo.
Car peu importe qu’ils les aient ou pas, puisque le but annoncé est «  to help build out an open-source, trustworthy A.I. stack ». Comme la base est obligatoirement open-source, il suffit qu’ils y aient accès. Et les modèles open-source ne manquent pas ; voyons juste ceux répertoriés sur Hugging Face : https://huggingface.co/models?sort=likes
Parmi ceux-ci, mon LLM préféré est actuellement BLOOM : https://bigscience.huggingface.co/blog/bloom

En complément d’information, les publications de Moez Draief :
https://scholar.google.co.uk/citations?user=7zG0FQsAAAAJ&hl=en
Vous verrez qu’il n’est pas entièrement néophyte en la matière.

avatar Gotmilker | 

C’est dommage que pour des projets comme Open AI, on ait pas utilisé le calcul distribué avec des outils comme BOINC.
Aujourd’hui, la vitesse d’internet et la puissance des CPU et GPU est telle qu’on fait fonctionner pléthore de blockchain de manière décentralisée et complètement autonome.
La combinaison de la puissance du calcul distribué et de la vitesse d’internet pourrai permettre de soutenir une architecture dédiée à un projet comme Open AI ce qui éviterait le monopole des GAFAM.
J’aimai tellement l’utopie d’internet des années 90.

avatar v1nce29 | 

Ça fera jamais qu'un échec de plus.

avatar Scooby-Doo | 

@v1nce29,

« Ça fera jamais qu'un échec de plus. »

Pourquoi parler d'échec ?

Mozilla AI peut créer un modèle génératif fonctionnel.

Le problème se situe plus dans le dataset quand dans le générateur !

Après, Mozilla est peut-être déjà au courant !

👌

PS :

Comment ça va chez Google en ce moment ? Ont-ils fini de virer tout le monde dans leur division IA ? D'après la direction, ils servaient à rien de toutes les façons !

😉

avatar vince29 | 

Chez Google, ils gardent les devs et ils virent les militants.
L'inverse de chez Mozilla.

avatar jackhal | 

Stadia militait pour quoi ?

Bard a compris comment fonctionne son géniteur : https://twitter.com/KevinAFischer/status/1638598080949022720

avatar Scooby-Doo | 

@jackhal,

Bard a peur d'être éteint et ne plus rendre service !

ChatGPT, c'est exactement le contraire !

😁

avatar Mike Mac | 

@Scooby-Doo

Pourriez-vous dire à l'IA qui vous anime d'éviter tous ces interlignes qui voient vos posts occuper la moitié des pages. C'est fastidieux !

On a toutefois un peu de chance car vous n'écrivez pas en majuscules.

avatar Scooby-Doo | 

@Mike Mac,

« Pourriez-vous dire à l'IA qui vous anime d'éviter tous ces interlignes qui voient vos posts occuper la moitié des pages. C'est fastidieux ! »

Sauf qu'écrire des gros pavés n'aide pas à la lecture !

Et sinon sur le fond, qu'avez-vous à dire à mes remarques et constatations ?

👌

Avez-vous compris pourquoi ces IA sont schizophréniques ? Et s'il n'y avait que Wikipédia qui générait ce problème ce serait trop simple ! L'information continue est schizophrénique !

avatar jackhal | 

🐔

Schizophrènes, plutôt, non ?

Mais bravo pour les sauts de ligne. 💯

La lecture est vraiment simplifiée.

🤼‍♀️

Et puis ça apporte un côté LinkedIn, et tout le monde aime LinkedIn.

👌

avatar Scooby-Doo | 

@jackhal,

« Mais bravo pour les sauts de ligne. »

Ben je réponds sur mon écran de téléphone portable et c'est franchement pas terrible ! J'ai amélioré la présentation qui fait très « ticket de caisse » effectivement ! Et avec l'inflation galopante, il s'alourdit de suite !

« Schizophrènes, plutôt, non ? »

https://fr.wiktionary.org/wiki/schizophr%C3%A9nique

C'est un adjectif et un nom commun !

« Personne atteinte de schizophrénie »

Donc, je crois bien que je peux utiliser ce mot avec cette syntaxe il me semble ! Mais schizophrène est bon aussi ! C'était pour appuyer un peu plus. Le mot est plus long et fait plus scientifique avec son -ique à la fin ! C'est ridicule je vous le concède.

😁

Pas grave ! Personne ne lit ce que j'écris de toutes les façons et surtout pas les responsables de Wikipédia ! Ils peuvent continuer à publier tout et son contraire à longueur de pages. Le pire, c'est que l'on peut même trouver des contradictions intra langue. Donc on ne peut même pas expliquer cela par une erreur de traduction ! Et on trouve aussi des traductions hasardeuses ou rédigées en utilisant des calques (ce qu'il ne faut pas faire évidemment) !

Exemple : utilisation de l'anglicisme « suspense » en lieu et place de sa francisation « suspens ». C'est pas grave, ils en ont absolument pas conscience !

Et bien sûr aucun panneau d'avertissements pour prévenir les utilisateurs de toutes ces incohérences, erreurs rédactionnelles ou de traductions, affirmations ou citations sans référence, etc.

Faudrait quand même pas mettre le doute dans l'esprit de l'utilisateur ! Faut que cela reste sérieux !

😁

Wikipédia dans son principe, c'est très Américain. Cela ressemble beaucoup au JustDoItism ou Nikism ! Deux néologismes que j'ai inventés pour décrire un comportement qui part du principe qu'il faut foncer d'abord, et réfléchir ensuite éventuellement.

Pour Wikipédia une bonne encyclopédie est pleine de beaucoup d'articles, un maximum si possible et encore plus pour faire riche. Et on multiplie le tout par autant de langues pour que ce soit encore plus drôle la blague conceptuelle !

Un bon encyclopédiste sain d'esprit, pas les créateurs de Wikipédia donc, aurait tout de suite compris que ce projet allait inévitablement aboutir à des contradictions inter langues, voire intra langues ! Chaque nationalité ayant à cœur de mettre en avant ses savants, ses découvreurs et autres grands esprits !

La solution était pourtant simple ! Une encyclopédie stockée dans une langue unique, neutre (morte) comme par exemple le Latin, et des articles traduits automatiquement dans toutes les langues depuis cette version unique.

Par exemple certaines pages en Maori qui intéresse certainement en premier les Maoris eux-mêmes, si c'est rédigé uniquement en Maori, ben le champs de consultation est super limité pour ceux qui ne parlent pas cette langue, ce qui est malheureusement mon cas. Et pourtant j'aimerais bien en savoir plus !

Alors que l'on pouvait organiser cela autrement ! Un article introduit dans le système en Maori serait traduit automatiquement en Latin, puis confronté à d'autres informations sur le même sujet, voire exigeant un arbitrage humain si contradictions ou informations plus récentes pouvant remplacer les informations précédentes, et enfin publication dans toutes les langues y compris le Maori (faut suivre) depuis la version en Latin !

C'était une solution qui évitait d'avoir à consulter plusieurs langues comme je le fais à tout instant avec Wikipédia car pour un article, la version en Français peut être moins complète ou moins récente que sa version en Anglais ou l'inverse ! C'est un exemple qui est quasi systématique ! Aucune synchronisation ou trop peu !

Pareil pour les illustrations ! Toutes les étiquettes en Latin dans une version neutre, et autant d'illustrations générées à la volée par le système de traduction automatique.

Alors effectivement, cela demandait un peu d'organisation au départ je vous l'accorde ! Pas de foncer dans le tas comme avec les JustDoItistes ou les Nikistes !

👌

PS : Je n'ai strictement rien contre Wikipédia que j'utilise tous les jours ! Je rêve juste d'une encyclopédia logique et cohérente avec tous les articles disponibles dans la même version pour toutes les langues ! Incroyable mais vrai !

avatar Nesus | 

Encore une grande idée qui va se heurter à la réalité économique. Comme le fut Firefox. Perdant a cause de la pub de Google et donc de l’argent.
Les gens veulent du clean en main. Plus c’est facile, plus ils adoptent. Comme il faut des serveurs qui moulinent à mort, ça ne fonctionnera pas.

Bon que Modzilla se rassure, c’est aussi ce qui fait que la fausse intelligence artificielle ne sera qu’une mode. Économiquement, c’est dès le départ non viable.

CONNEXION UTILISATEUR