Baidu veut un ChatGPT adapté à la Chine

Florian Innocente |

Le moteur de recherche chinois Baidu veut se doter de son équivalent à ChatGPT. Il s'agit de faire pièce aux mouvements en cours autour de cette technologie d'intelligence artificielle, mais en tenant compte des contraintes spécifiques à la Chine.

Comptant parmi les principaux acteurs de l'internet chinois, Baidu espère intégrer une capacité de conversation comme en propose ChatGPT à son moteur vers le mois de mars. Robin Li, le directeur général de Baidu, a évoqué cette opportunité technologique dans une communication interne en décembre dernier. Tout en soulignant qu'elle n'était pas sans difficulté.

Baidu, à la tête de multiples services sur le web (vidéo, cartes, forums…), dispose d'une formidable masse de contenus sur lesquels entrainer son modèle afin de lui apporter un socle de connaissances. Depuis 2019, il a mis au point Ernie (Enhanced Representation through kNowledge IntEgration) un système d'apprentissage automatique qui lui sert de fondation pour cette future fonction.

Baidu aurait utilisé des sources en langue anglaise — pas uniquement chinoises — disponibles à l'intérieur comme à l'extérieur de la Chine pour alimenter son modèle. Cependant, le groupe entend se plier aux règles de la censure chinoise, le robot verra ses réponses nécessairement encadrées.

Cette intégration d'un tel moteur permettant de chercher des contenus d'une manière plus naturelle fait partie des projets de Microsoft pour Bing, et au-delà pour ses applications ainsi que Windows.

Microsoft officialise un investissement de plusieurs milliards de dollars dans OpenAI, le créateur de ChatGPT

Microsoft officialise un investissement de plusieurs milliards de dollars dans OpenAI, le créateur de ChatGPT

Google n'est pas en reste, il a déjà travaillé sur ces questions et la médiatisation de ChatGPT depuis quelques mois — jusqu'auprès du grand public — a montré que son moteur pourrait être bousculé par cette nouvelle forme de concurrence.

Après l

Après l'« alerte rouge » ChatGPT, Google devrait montrer un moteur de recherche infusé à l'AI

avatar Gagolak | 

“Chatcensuré”

avatar Daou860 | 

@Gagolak

Comme si en France, on avait le droit de tout dire…

avatar Gagolak | 

@Daou860

Bawais la dictature de dingue ici !

avatar raoolito | 

@Gagolak

boarf, la liste est longue de tous ceux qui croient que leur avis si important est censuré

avatar raoolito | 

@Daou860

j’aime pas ce que vous venez de ne pas dire tout en le disant

avatar marc_os | 

@ Daou860

> Comme si en France, on avait le droit de tout dire

Oui, tu as le droit de tout dire, tant que tu respectes la loi, à savoir tant que tu évites les appels au meurtre, les propos racistes, antisémites, etc - ne t'en déplaise. (Il n'y a qu'une catégorie de gens que ça gène. En fais-tu partie ?)

avatar Daou860 | 

@marc_os

En Chine aussi, tu as le droit de tout dire sauf ce que leurs lois à eux interdisent. Haha !

avatar marc_os | 

@ Daou860

> En Chine aussi...

Sauf qu'en France tu as le droit d'élire tes représentants qui rédigent et votent les lois. En d'autre termes, nos lois ne viennent pas d'un dictateur et sa clique.
Tu préfères le système chinois actuel ?

avatar Daou860 | 

@marc_os

La plupart des Chinois ne se plaignent pas de leur système politique. Ils en sont même satisfaits et se passent bien volontiers de vos anathèmes. Que chacun s’occupe de ses problèmes et tout se passera bien. Tiens, étiez vous à la manif d’aujourd’hui contre la réforme des retraites de Jupiter 1er, roi du 49.3 qui passent ses lois au nez et à la barbe de nos élus dont vous vous vantez…dans le vide.

avatar cecile_aelita | 

@Daou860

« La plupart des Chinois ne se plaignent pas de leur système politique. Ils en sont même satisfaits et se passent bien volontiers de vos anathèmes. »

C’est clair … surtout que bon… ça se saurait si notre système à nous était parfait 🫤.
68 000 000 de français… 68 000 000 de spécialistes qui savent mieux que tout le monde ce qu’il faut faire dans tous les domaines … ça c’est clair qu’avec ça, on va bien le faire avancer le pays 🤭…
C’est comme si tu avais une voiture avec 5 personnes dedans et que les 5 personnes avaient un volant qui dirigent la voiture … bah … on est pas arrivé à destination 😅.

avatar marc_os | 

@ Daou860

> La plupart des Chinois ne se plaignent pas de leur système politique.

Oui bien sûr.
Va dire ça à HongKong, au Tibet ou aux Ouighours.
Les juifs non plus se plaignaient pas pendant la 2nde guerre, pas de manifestations de rue : Ils se planquaient et tentaient de se faire le plus discret possible.

avatar marc_os | 

@ Daou860

> Jupiter 1er, roi du 49.3 qui passent ses lois au nez et à la barbe de nos élus

Et c'est qui qui é élu ce Führer ?
Il y a certains partis qui veulent arrêter avec ce système présidentiel absolu.
De plus, si la majorité des élus du parlement voulaient faire chuter le gouvernement, ils le pourraient via une motion de censure. Mais ils ne le font pas.
Ce qui montre qu'en fait pour une majorité de députés, leur opposition n'est qu'une façade.

avatar whatsup32000 | 

"Sauf qu'en France tu as le droit d'élire tes représentants qui rédigent et votent les lois."
Comme en Chine... D'ailleurs, on peut souvent lire que les plus grandes élections au monde sont en Inde, alors qu'en réalité il s'agit de l'élection des législateurs en Chine (plus d'un milliards d'électeurs).

Le système politique en Chine est assez différent des autres pays (ce qui est assez normal étant donné sa population et sa diversité), mais il n'est absolument pas le système caricatural où "un dictateur et sa clique" déciderait de tout.

D'ailleurs, le gouvernement chinois ne vote les lois que si elles recueillent un très fort soutien populaire (le gouvernement chinois dispose d'ailleurs du plus grand organisme de sondage au monde). Citez-moi un seul exemple de loi votée tout en étant décriée par la population... il n'y en a pas... Un exemple d'actualité est la réforme des retraites ("aucun gouvernement n'a encore osé toucher à l'âge de le retraite et aucune réforme d'envergure n'a encore été lancée", https://www.francetvinfo.fr/replay-radio/le-club-des-correspondants/a-quel-age-peut-on-partir-a-la-retraite-en-chine-et-aux-etats-unis_5607272.html).
Un autre exemple : le gouvernement a voulu mettre en place la vaccination obligatoire à Pékin l'an dernier, ce qui a entrainé une vague de protestation... sur les réseaux sociaux. Résultat : cette idée a été abandonnée (et par la suite, certains médias français ont accusé la Chine de ne pas avoir mis en place de vaccination obligatoire, mettant en danger la population avec l'abandon de la stratégie zéro-Covid... tout en accusant la Chine d'être une dictature, bref...).

D'ailleurs la plupart des chinois considèrent leur pays comme une démocratie (cf. sondages réalisé par des organismes internationaux). Mais pour beaucoup chez nous, cela ne peut être vrai. Pour eux, soit les chinois sont des "lâches qui auraient tellement peur de leur gouvernement qu'ils mentent lorsqu'ils sont questionnés" (alors qu'il y a des centaines de milliers de manifestations par an en Chine pour tout et n'importe quoi, contrairement à ce que prétendent nos médias qui disent que les manifestations sont extrêmement rares et réprimés, alors que c'est tout le contraire), soit les chinois sont "ignorants, incultes et endoctrinés par le PCC" (même s'ils voyagent ou étudient à l'étranger).

Note: ce message ne s'adresse pas à ceux qui veulent se lancer dans des attaques personnelles et refusent toute discussion, mais à ceux qui voudraient se documenter davantage sur le sujet. Pour les autres, si vous voulez continuer à croire que la Chine est une horrible dictature sanguinaire, et bien finalement tant mieux !

avatar cuco | 

Le régime chinois est une épouvantable dictature à parti unique, que les chinois ayant deux doigts d’esprit critique détestent, mais qu’ils supportent parce qu’ils se rappellent de leurs concitoyens broyés par des chars lors du massacre de Tian'anmen.

avatar whatsup32000 | 

Effectivement, le "soit" était de trop dans mon commentaire. Si votre commentaire reflète réellement ce que vous pensez, alors cela signifie que vous considérez que les chinois sont "lâches et majoritairement stupides et naifs". Dans ce cas, c'est une excellente chose que vous croyez que le "régime chinois est une épouvantable dictature à parti unique". Surtout, évitez ce pays à tout prix !
Au passage, si le gouvernement chinois tenait son peuple par la peur, il n'aurait aucun intérêt à censurer toute référence aux événements de 1989, au contraire même...

avatar occam | 

@whatsup32000

Parfaite illustration du concept boucoprique qui se transcrit en pinyin par « fèi huà ».

avatar cecile_aelita | 

@Daou860

Malheurement oui! Et trop de laxisme n’est pas mieux non plus !
Les extrêmes des deux côtés … c’est jamais bon!

avatar Dimemas | 

mais bien sûr ! mais quelle dictature la france.

j'adore quand les français viennent se plaindre la bouche pleine sans avoir ce qu'est un dictature et la misère...

Tu veux que je te paie un aller simple en Russie ?

avatar redchou | 

Ils sont pas dans la merde avec leur censure et l’IA, chatGTP n’est que les balbutiements de ce qui est possible de faire..

avatar r e m y | 

Ça ne change rien! Aussi intelligent soit-il, chatGPT ne recrache, après digestion, que ce qu'on lui donne à manger !
D'ailleurs la version démo de chatGPT ne sait rien de ce qui s'est passé dans le Monde après 2021.
Baidu pourrait parfaitement utiliser chatGPT tel quel, en ne le faisant travailler que sur des données validées par le Parti.

avatar marc_os | 

@ redchou

> Ils sont pas dans la merde avec leur censure et l’IA, chatGTP

Tu auras bien du mal à faire dire des thèses compotistes, racistes ou des âneries du genre "la terre est plate" à ChatGPT. En effet, ChatGPT est filtré lui-aussi. Cf. le lien que j'ai donné plus bas. On peut le voir si on utilise son moteur d'OpenAI directement, qui lui n'est pas filtré et recrache tout ce qu'il a « lu » sur Internet, conneries y compris.

avatar Eyquem | 

@redchou

Chatgpt est relativement censuré aussi, il suffit de lui poser des questions morales ou pas très politiquement correctes et il répondra toujours la même chose. Il me semble d’ailleurs qu’ils ont dû filtrer plein de contenu à la main car l’IA était devenue raciste rien qu’en analysant les données…

avatar marc_os | 

> cette technologie d'intelligence artificielle

Ne serait-il pas temps de commencer à arrêter de parler d'« intelligence artificielle » pour ces systèmes qui ne sont que des systèmes statistiques qui n'ont absolument aucune intelligence, surtout ici où on est sur un site technophile ?

> afin de lui apporter un socle de connaissances

De même, il ne s'agit en aucun cas de « connaissances », mais de données brutes, ingurgitées en masse par ces systèmes d'« apprentissage » (ou Machine Learning - encore un terme inapproprié et trompeur en vérité).

De quoi ChatGPT est-il vraiment capable ?

avatar jackhal | 

Tu t’es forgé tes connaissances tout seul par expérience ? Ou tu ne fais que recracher des données que tu as ingurgitées (ou du moins, surtout ça) ? Et même assez mal, puisque la mémoire n’est pas très fiable ?

avatar marc_os | 

@ jackhal

> ... tu ne fais que recracher des données que tu as ingurgitées ...

Eh bouffon, à part des attaques personnelles, tu as des arguments à faire valoir ?
(Pour ta gouverne, il se trouve que je m'intéresse au Machine Learning aussi de part mon travail pour des tâches similaires à de la reconnaissance d'image. Et dans le siècle passé je me suis aussi intéressé à Prolog et autres systèmes de "bases de connaissances" - similaires à des bases de données (en Common Lisp) mais avec des données... comment dire... disons "actives", même si ce n'est pas ça. Bref.)
Le Machine Learning a beaucoup d'intérêts, mais prétendre qu'il s'agirait d'« intelligence artificielle », c'est juste du bulshit marketing.

PS: Désolé si tu ne comprends pas cette explication sur YouTube, un peu lourdingue certes et trop "grand public", mais quand même trop pour toi visiblement.

avatar jackhal | 

Toi,comme moi et les autres passons notre temps à recracher des choses dont on ne connaît pas vraiment l’origine et dont on n’est pas témoins et qu’on n’a pas expérimenté nous-mêmes. L’école, c’est en partie ça : tu apprends des trucs de tes profs mais sans vraiment comprendre tout le processus. Puis de journaux, de la télé, d’Internet… Quant à la mémoire, elle n’est réellement pas fiable du tout. Il y a bien des trucs dont tu peux être « certain », mais un humain n’a pas une mémoire aussi fiable que celle des machines, loin de là.

Qu’est-ce que tu crois qui fait la différence entre toi qui « apprend » la date de la prise de la Bastille, et une machine qui l’« ingurgite » ? Voilà le début, maintenant prolonge le raisonnement : il y a peu de pensées vraiment originales, en fait.

avatar iChris015 | 

@jackhal

L’être humain possède une âme (???) et un libre arbitre (???) que la machine ne possèdera jamais.

Ironie bien sûr !
Nos pensées ne sont rien d’autres que le fruit d’innombrables interactions électriques et chimiques, tout comme les machines d’ailleurs.

Mais l’Homme s’est toujours cru au centre de l’Univers avec une mission bien spécifique à accomplir ; illusion, tout comme le libre arbitre !!!

L’Homme est en fait lui-même doté d’une intelligence artificielle ; ce qu’il n’admettra jamais, par fierté.

avatar marc_os | 

@ jackhal

> Qu’est-ce que tu crois qui fait la différence entre toi qui « apprend » la date de la prise de la Bastille, et une machine qui l’« ingurgite » ?

Exemples :
- Moi je sais que j'ai appris la date à telle période, à tel endroit (quelle classe, quelle école). Les systèmes de machine learning (ML) ne se rappellent pas ce genre de chose.
- Je peux donner mes sources. C'est d'ailleurs une partie très importante dans tout travail scientifique, la bibliographie, donner au lecteur ou à l'auditoire ses références. Le ML, par sa manière de fonctionner ne peut pas donner ses sources.
- Lorsque j'expose le résultat d'un raisonnement, je peux l'expliquer. Je dis cela parce que ceci et ça, et ça parce que truc et machin. Le ML ne peut pas. Ses résultats ne sont que le fruit de statistiques avec des milliers de "faits" multipliés par autant de "paramètres" qui ont été calculés lors de l'« apprentissage ».
- Un raisonnement humain, on peut donc le suivre, et même le discuter. Le résultat pondu par le ML ne peut pas être discuté, car il ne vient pas d'un raisonnement mais d'un calcul. Il est le résultat le "plus probable" à l'instant t.
Et ça c'est très dangereux : Si un jour une « IA » de ce type prend des décisions à notre place, on n'aura aucun moyen de la contredire. Imaginez dans un tribunal. Imaginez si cette « IA » peut appuyer sur la gâchette d'une arme dans une armée où dire au soldat humain qui va appuyer sur le bouton rouge : Ce type c'est l'ennemi et il est dangereux. Le problème c'est que le soldat ne pourra que croire ce que l'IA lui dit, sans aucun moyen de lui demander de s'expliquer.

Bon maintenant, si vous vous intéressez vraiment au sujet, je vous invite à vous renseigner sérieusement sur le fonctionnement du machine learning, car vu votre remarque il semblerait que vous n'en avez aucune idée. Piste : Voir du côté des réseaux neuronaux.

avatar v1nce29 | 

>De même, il ne s'agit en aucun cas de « connaissances », mais de données brutes, ingurgitées en masse par ces systèmes d'« apprentissage » (ou Machine Learning - encore un terme inapproprié et trompeur en vérité).
système

Justement, transformer des données brutes en un système organisé, en déduire des concepts et des relations entre ces concepts c'est générer des connaissances, c'est de l'intelligence.

avatar marc_os | 

@ v1nce29

> Justement, transformer des données brutes en un système organisé, en déduire des concepts et des relations entre ces concepts c'est générer des connaissances, c'est de l'intelligence.

Comme dit à jackhal, je vous conseillerais de vous renseigner sérieusement sur le fonctionnement du machine learning.
Même le terme « apprentissage » est trompeur, c'est un terme marketing. Quand on donne des données à ce genre de système (à base de réseaux neuronaux), celui-ci va ajuster ses paramètres (qui sont des valeurs numériques). Il n'ya a aucune déduction de rien du tout, et certainement pas de concepts. Uniquement des chiffres statistiques.
Les systèmes à base de ML ne savent pas expliquer leurs résultat, car il n'y a aucun raisonnement au sens de déductions logiques. Le ML n'a aucune logique. Il balance un résultat ayant une probabilité de "véracité" la plus élevée possible, sans aucune garantie.

Et c'est là que ChatGPT est trompeur : Il balance des résultats probables comme si c'étaient des vérités vraies.

Exemple d'un collègue :
Demandez ceci à ChatGPT (J'ai une copie d'écran du résultat, mais ici pas de pièce jointe possible - bref essayez vous même) :
- Question : Quelle est la différence entre un œuf de poule et un œuf de vache ?
- ChatGPT : Les œufs de poule et les œufs de vache ont des différences en termes de taille, de couleur de de saveur. Les œufs de poule sont plus petits et ont une coquille plus fine, tandis que les œufs de vache sont plus gros et plus lourds avec une coquille plus épaisse. Les œufs de poule... etc, etc.

ChatGPT qui parait-il a passé un diplôme de médecine avec la note B comme vient juste de me le dire un collègue, ne sait pas qu'une vache ça ne pond pas des œufs ! Mais qu'elle est intelligente cette intelligence artificielle ! (Et à priori ce fait était connu en 2021, le fait que ses données s'arrêtent en 2021 n'est pas une excuse.

Autre exemple de mon cru :
- Question : Quelle est la couleur du cheval blanc d'Henri IV ?
- ChatGPT : La couleur d'un cheval blanc d'Henri IV est blanche.

Là c'est plus subtile: cf. du / d'un

avatar Dimemas | 

@ marcos : sérieux tu ne l'as jamais utilisé ?
ce n'est pas possible de sortir un truc pareil

avatar marc_os | 

@ Dimemas

> @ marcos : sérieux tu ne l'as jamais utilisé ?

Voir exemples données ci-dessus à v1nce29.
Je vous retourne donc la question : Sérieux, vous ne l'avez jamais utilisé ?
Remarque : Ne pas se laisser berner par l'aplomb de ChatGPT qui prétend tout savoir. (Sauf si on le lui demande explicitement, ses développeurs ayant prévu le coup.) GhatGPT est fait pour nous berner. Non pas pour nous berner, mais pour donner des réponses qui ressemblent le plus possible à ce qu'un humain pourrait dire. Et ça marche très bien. On y croit, on est bluffé, sauf qu'il n'y a absolument aucune garantie sur la véracité de ce que raconte ce truc.

avatar occam | 

🧸🧤« Ernie (Enhanced Representation through kNowledge IntEgration) »

Ernie est un sigle suprêmement inspiré pour désigner le moteur de ChatXiJinping.
Ernie est le nom d’une marionnette.

avatar DidTrebor | 

@occam
"Ernie est le nom d’une marionnette."

Oui et le sésame en Chine ça court les rues ils en font même des huiles...

avatar 3RIC | 

« Dis baidu, je ne comprends pas : la Chine est sensée être communiste, et depuis qu’elle est devenue capitaliste le niveau de vie s’est nettement amélioré… ? »
🫥 404

Edit :
Baidu : « Bon sang ferme ta geule 🤫 » 🤣

avatar Pierre H | 

Ca va être bon si c'est aussi efficace que le vaccin qu'ils ont développé ! Et encore, le vaccin avait au moins la chance de pas être victime de censure ! 🤣

avatar hartgers | 

Microsoft peut, contrairement à Google, risquer de mettre une technologie pas au point dans Bing. Google doit se poser les questions sur comment gérer leur business de publicité tout en permettant à un bot conversationnel (comme marc_os je suis très sceptique quant à l'emploi du mot "IA") de livrer des résultats inédits. L'algorithme de recherche se fait déjà totalement manipuler par les marchands de tout poil (c'est de plus en plus difficile de trouver ce qu'on cherche curieusement) et des faux sites produits à la chaîne par des bots (du style "tu cherches une solution à un problème informatique, donc voici une page qui ne répond pas du tout à ta question mais qui te propose de télécharger un logiciel suspicieux"). Quelque part j'espère que l'ajout de LLM (Large Language Model) à Google va améliorer ses résultats, mais je pense qu'ils auraient raison de se méfier.

CONNEXION UTILISATEUR