Les IA crient famine dans leur recherche de nouvelles données à moissonner

Florian Innocente |

Les données textuelles, sonores et vidéos sur internet sont une ressource vitale pour les moteurs d'intelligence artificielle. ChatGPT, Gemini et leurs concurrents ont besoin de récupérer d'immenses volumes d'informations pour gagner en précision. Des besoins qui se heurtent à des questions de droits d'accès et de disponibilité de ces ressources.

Vers la fin de 2021, OpenAI, le créateur de ChatGPT, s'est retrouvé face à un problème d'approvisionnement en données, raconte le New York Times dans un article sur la quête éperdue de Microsoft, Google, Facebook, mais aussi Apple pour trouver, avaler et traiter toujours plus d'informations.

IA : Apple aurait passé un contrat avec Shutterstock pour utiliser sa banque d’images

IA : Apple aurait passé un contrat avec Shutterstock pour utiliser sa banque d’images

Ces systèmes d'intelligence artificielle construisent leurs réponses sur la foi de bases de connaissance. Plus elles sont importantes, d'origines variées et de qualité élevée, plus ces réponses gagnent en précision. OpenAI a alors constaté qu'il avait déjà avalé tout ce qu'il était possible de trouver comme contenus textuels fiables en langue anglaise.

Pour continuer d'entrainer la version suivante de son moteur, GPT-4, il lui en fallait (beaucoup) plus. Un an plus tard, OpenAI lançait Whisper, un outil de transcription de pistes audio en texte. OpenAI s'en servit pour traiter notamment les vidéos de YouTube et faire grossir son index d'une nouvelle masse de données.

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Transcription audio : énorme amélioration de performances pour Whisper sur Mac

Plus d'un million d'heures de vidéos YouTube furent analysées par Whisper, d'après les sources du New York Times et il fut utilisé également sur des podcasts et des livres audio. Les employés d'OpenAI savaient qu'ils s'aventuraient dans une zone grise en matière de droits d'utilisation. L'exploitation de vidéos YouTube par ce biais peut être considérée comme illégale, mais il y a une part laissée à l'interprétation de ces conditions d'utilisation.

MacWhisper en action sur une vidéo YouTube.

Officiellement, Google a déclaré n'avoir eu aucune connaissance des pratiques d'OpenAI, mais d'après les contacts du quotidien, il était parfaitement au fait de cette moisson réalisée par OpenAI. Google ne s'en est pas ému davantage, car lui-même avait puisé dans ce contenu pour entrainer son moteur. En sermonnant publiquement OpenAI il risquait de se retrouver en porte-à-faux face à ses créateurs sur YouTube.

Pour éviter toute mésaventure, Google a ensuite revu les conditions d'utilisation des contenus publics produits par ses services Google Docs, Sheet et Slides afin d'autoriser leur exploitation pour l'entrainement de moteurs d'IA.

Lancé dans la même course initiée par OpenAI et son partenaire Microsoft, Meta s'est rapidement retrouvé au pied du même mur : plus assez de données. Plusieurs pistes furent discutées, comme d'acheter Simon & Schuster, l'un des plus gros éditeurs au monde afin d'avoir accès à ses livres, lesquels contiennent des données considérées comme fiables.

D'autres chez Meta proposèrent de payer jusqu'à 10 $ par livre pour en obtenir tous les droits. Certains expliquèrent qu'ils avaient déjà résumé des livres, des essais et d'autres travaux trouvés sur le web, sans autorisation et qu'il était possible de continuer à en aspirer davantage, quand bien même il y avait des risques de procès (le New York Times a attaqué OpenAI et Microsoft pour cette même raison).

Un avocat de Meta fit valoir que cela posait un problème éthique, mais sa remarque fut accueillie par un silence des autres participants. Négocier des droits implique de longues discussions et ces protagonistes de l'IA courent un marathon à la vitesse d'un sprint. Lors de ces échanges, il fut aussi expliqué que des contractuels en Afrique avaient été payés pour compiler des résumés de contenus de fiction et de non-fiction, dont certains étaient protégés par des droits d'auteur. Ces moissonneuses ratissent large et ne font pas de tri entre ce qui peut être pris et ce qui ne doit pas l'être.

Meta n'est pas en manque de contenus avec ses réseaux sociaux, toutefois cette masse n'est pas nécessairement d'une grande qualité ou utilité. Au bout du compte, le problème numéro un reste le manque de données utilisables et suffisamment qualitatives pour faire progresser ces moteurs. On parle actuellement de l'utilisation de volume équivalent à plusieurs centaines de milliards de mots.

Mais pour franchir un nouveau cap dans l'amélioration de ces intelligences artificielles, il faudrait faire un bond en quantité de données pertinentes indexées : l'offre est dépassée par la demande.

Une piste étudiée est de faire en sorte que ces IA produisent de nouvelles données à partir de celles qui sont déjà en leur possession. Des données dites "synthétiques". Avec le risque que ces IA finissent par tourner en circuit fermé et ne fassent qu'accentuer des biais ou des erreurs qu'elles font déjà avec les informations dont elles disposent.

Source
Illustration d'accroche : OpenAI/Ruby Chen
avatar raoolito | 

@marc_os

les changements légaux plus ou moins brusque chez Google sont malheureusement une habitude

avatar v1nce29 | 

Pas besoin d'aller à l'étranger. SFR

avatar ataredg | 

Et pendant ce temps, les IA "non-officielles" siphonnent le web ... Je dis ça ...

avatar Oncle Sophocle | 

"les IA "non-officielles" siffonnent le web"

Et le web va finir en chiffons.

avatar ataredg | 

"Et le web va finir en chiffons."

Errare Oumanum est.

avatar Oncle Sophocle | 

C'était juste l'occasion d'une blague, et finalement les deux versions cohabitent très bien.

avatar ataredg | 

Et ma réponse l'était aussi.

avatar donatello | 

Un peu de mal avec l'idée d'interdire ou taxer l'utilisation de données mortes qui moisissent au fond de l'Internet juste parce que quelqu'un a trouvé le moyen d'en faire quelque chose d'intéressant.

Cela me fait penser à cette réflexion (lue sur Internet du coup je sais pas si j'ai le droit de la citer) : si les bibliothèques étaient inventées aujourd'hui, les ayants-droits trouveraient le moyen de les faire interdire.

avatar hartgers | 

Si vous n'arrivez pas à faire la différence entre une bibliothèque et une multinationale de la Silicon Valley, en effet on peut faire des analogies un peu tordues.

avatar raoolito | 

@hartgers

bah non les bibliothèques gagnent de l'argent, elles propose nt au public la lecture des livres sans autorisation particulière, les choses très anciennes ou des choses très nouvelle sans même parler des revues...

edit: je confirme que les bibliothèques n'ont comme limitation qu'une question de contenu mais pas d'origine des livres.

avatar vincentn | 

@raoolito

Euh… Les bibliothèques, même les plus richement dotées, gagnent rarement de l’argent (la BNF, l’une des plus grandes du monde, a ainsi un déficit de 11 millions d’euros en 2023).

S’il y a une obligation de dépôt légal (en gros toute œuvre publiée doit avoir un exemplaire versé à la BNF pour la France, et ce depuis François 1er) et une politique d’acquisition volontaire, les prêts ont un coût, souvent invisibles pour l’usager!
L’Etat verse ainsi annuellement 1,5 euros par inscrit dans une bib (1 euros pour une BU) aux sociétés gestionnaires des droits d’auteurs.
De même, les bibliothèques/médiathèques ne passent pas par la Fnac ou une librairie mais sont obligées de passer par des grossistes pour acheter les ouvrages (et c’est plus cher que dans le commerce), à charge pour ces intermédiaires de reverser 6% HT du prix aux sociétés gestionnaires des droits.
Et je ne parle même pas des droits à la copie (si vous faites une photocopie d’une page d’un bouquin, la bibliothèque paye une redevance aux ayants-droits).
Il en va de même pour les revues, la presse, les bases de données, les œuvres multimédias (disques, films…).

avatar oomu | 

merci.

avatar hartgers | 

@ raoolito : La confusion émane de votre commentaire. Au risque de me répéter, vous non plus ne savez visiblement pas faire la différence entre une bibliothèque et une multinationale de la silicon valley. Faire des sophisme en comparant les deux objets est l’équivalent de Socrate le chat.
Un petit indice pour vous mettre sur la voie : la différence entre ce qui est public ou privé.
Une bibliothèque ne fait pas ce qu’elle veut, quand elle s’abonne à une revue elle la paye et permet à un nombre limité de personnes d’y accéder (à moins que vous lisiez avec plusieurs personnes en même temps ?). Un livre n’est pas copié indûment pour ensuite en régurgiter un plagiat, et si vous, usager de la bibliothèque, vous copiez le livre, c’est vous qui vous mettez dans l’illégalité. Il y a des droits à la reproduction, des droits d’usage, que les bibliothèques respectent. Certains documents par exemple sont uniquement disponibles à la consultation pour ces raisons de droits à la reproduction, entre autres.
Les bibliothèques sont un bien commun d’utilité publique, les modèles de langage ne servent qu’à enrichir des entreprises déjà extrêmement riches, en mal de relais de croissance. La différence entre les deux me paraît flagrante, même si j’en conviens que si on compte sur l’IA pour s’informer ou ne plus à avoir à lire des livres, cela doit être compliqué de les discerner.

avatar donatello | 

Si le privé c'est mal, alors il faut l'interdire.

Certains ont essayé cela dit.

avatar hartgers | 

@donatello : je n'ai jamais dit cela. Vous faites une analogie qui ne fonctionne pas, c'est à vous de la défendre, pas à moi.

avatar donatello | 

Je ne fais pas d'analogie, j'ai dit "cela me fait penser à (...)"

Après, je suis prêt à admettre une pointe de mauvaise foi, mais je suis globalement fatigué de voir ces réactions pavloviennes dès qu'il est question d'IA : protection des données, interdiction, taxes, régulation.
Avec à chaque fois des arguments grandiloquents "Il faut sauver la créâtion", "protéger le sâvoir", le"bien cômmun"...
Comme si le fait d'entrainer une IA sur un vieux livre que personne n'a lu depuis 150 ans, ou une vidéo YouTube à 11 vues allait faire basculer l'humanité dans l'obscurantisme.

Chaque nouveauté génère son lot de peurs irrationnelles, il me semble qu'on est en plein dedans.

Au final qui gagne quoi avec ces interdictions et ces régulations ?

En tant que citoyen, à chaque fois que l'UE se mêle de réguler les GAFAM, cela se traduit concrètement par des emmerdes en plus : devoir cliquer 100 fois par jour sur des boutons "J'accepte", ne plus pouvoir cliquer sur une carte après avoir fait une recherche sur Google. Merci le régulateur.

Les seuls qui semblent y gagner sont des petits groupes de pression qui réussissent à maintenir leur petit fromage subventionné sans rien créer ni jamais innover, en agitant des peurs millénaristes sous les yeux des politiques.

avatar hartgers | 

"Comme si le fait d'entrainer une IA sur un vieux livre que personne n'a lu depuis 150 ans, ou une vidéo YouTube à 11 vues allait faire basculer l'humanité dans l'obscurantisme. "
Encore un exemple sorti du chapeau qui est un peu exagéré.
Davantage de régulation sur les cookies ou les monopoles, c'est effectivement un peu pénible au quotidien (mais un problème de riche très honnêtement), et je pense salutaire (et je trouve qu'ils ne vont pas assez loin personnellement, mais là n'est pas la question). Il n'est pas question de refuser une nouvelle technologie par principe, et pour le moment l'IA act est très timide, mais de définir dans quel cadre la société peut être accompagnée par ces technologies. Les droits d'auteur, la "créâtion" et le bien commun vous paraissent peut-être futiles, mais ce sont nos piliers culturels et il n'y a aucune raison pour que nous les donnions sans nous poser de question. Je comprends bien sûr et je suis d'accord que tout cela s'accompagne d'un règlement de compte qui ne profite pas aux citoyens. Par exemple j'ai observé que la lutte contre le piratage en P2P nous a fait perdre, comme victime collatérale, des milliers d’œuvres méconnues et introuvables sur les plateformes de streaming. C'est là où un savant dosage de régulation et de liberté d'innover peut intervenir, afin de déterminer ensemble ce qui pourrait être socialement utile (par exemple tout ce qui peut aider les personnes porteuses de handicap), et ce qui est néfaste pour notre société (les entretiens d'embauche fait par des bots, les escroqueries vocales, les usurpations d'identité, le vol de productions artistiques sans consentement explicite des auteurs, etc.).
Par ailleurs, il y a de vraies questions à se poser sur les droits d'auteurs et le réusage de contenus fait par d'autres. Le meilleur exemple en rapport avec ce sujet, c'est l'ubiquité de l'amen break, qui n'a pas rapporté un centime aux auteurs du morceau original. D'un côté, c'est important de reconnaitre et rémunérer correctement les auteurs, de l'autre, le fait qu'ils n'aient jamais porté plainte a permis l'émergence de nombreux genres de musique qui n'auraient tout simplement pas existé sans l'usage du sample. Alors que faire ? Hé bien trouver la fine ligne de démarcation entre usage créatif d'un côté, et pillage pour exploiter la ressource de l'autre. Le web a été une co-construction par des milliards d'être humains. On peut parler d'un bien commun qui a été accaparé par les GAFAM et autres. Les entreprises de la Silicon Valley exploitent des travailleurs et travailleuses pauvres en Inde, au Sri Lanka, au Kénya, pour améliorer ces modèles, modérer les contenus, et autres tâches ingrates. L'apparente magie de cette technologie exploite les êtres humains, ce qui n'est pas non plus souhaitable.
Tout comme nous avons réussi, collectivement, à arrêter certaines pratiques par le passé (l'exemple des aérosols et de la couche d'ozone est intéressant de ce point de vue), poser des moratoires sur des technologies dangereuses (le clonage des êtres humains), nous pouvons poser des limites tant qu'il en est encore temps.

avatar rikki finefleur | 

hartgers
Je vous ferais remarquer que les ingénieurs, médecins, fraiseurs , informaticiens, mécaniciens, bouchers, apiculteurs etc.. apprennent et utilisent des théories, des techniques qu'ont révélés des anciens.
Or ces anciens n'ont pas monnayé leur connaissance, ni l'utilisation de celle-ci.
En réalité la création pure est un phénomène assez rare. Le reste se sont des sauts de puce.

Et comme vous parlez de création artistique lorsque je vois le nombre de peintre, graphiste, ou d'architecte qui se recopient copieusement entre eux , en reprenant le même style, je ne sais pas si on peut parler de création. D'ailleurs l'histoire de la peinture est assez remarquable en ce sens.

avatar hartgers | 

@rikki finefleur : La création se fait en effet de manière itérative, de même que l’avancée en science, ou l’apprentissage. Il ne vous aura pas échappé qu’il y a des différences fondamentales entre une machine qui apprend toutes ces choses en consommant une énergie de dingue et pompant des données, et un être humain somme toutes limité qui apprend sur un temps plus ou moins long des compétences sur un domaine. Bien sûr les humains plagient, copient, s’inspirent. Et c’est justement parce que ces machines vont permettre aux humains de faire cela multiplié par 1000000 que cela pose problème. Il n’y a que 24h dans une journée et pour un humain lambda cela représente une quantité limité de copie, apprentissage, pratique. Comparer une machine qui peut lire un milliard de livres en quelques jours avec un groupe de lecture de la bibliothèque du coin ce serait un peu étrange, non ?
Néanmoins je conçois que d’imaginer un présent où les bibliothèques n’existent pas (mais elles existent donc qu’en sait on) et qu’il faudrait les inventer contre le droit d’auteur puisse permettre de réfléchir à la question de ces droits d’auteur que j’ai mentionnés avec l’exemple complexe de l’amen break. Encore une fois la comparaison micro/macro, public/privé, commun/individuel me semble toujours démagogique car elle feint d’ignorer les intérêts économiques derrière un projet comme celui des IA génératives. Ils ne font pas ça pour le bien de l’humanité mais pour aller chercher les milliards dans leurs poches profondes.

avatar rikki finefleur | 

Je trouve au contraire que l'argument de Donatello est très pertinent.
Si la bibliothèque municipale était un ensemble nouveau dans notre monde , nul doute que les ayants droits l'auraient fait fermer immédiatement. Généralement ils n'aiment pas trop partager la culture sauf quand elle est monnayable.

avatar hartgers | 

@rikki finefleur : j’ajoute que le commentaire de Vincentn plus haut explique mieux que moi comment une bibliothèque fonctionne, et c’est très contrôlé justement.

avatar Vanton | 

« Meta n'est pas en manque de contenus avec ses réseaux sociaux, toutefois cette masse n'est pas nécessairement d'une grande qualité ou utilité »

Ooohhh alors ça alors mais dis donc hein qui l’aurait cruuuu ?

avatar oomu | 

ne me regardez pas, j'ai toujours écrit que de la Grande Qualité sur les réseaux asociaux (et ce forum, évidemment, promis, pfiuu, juré, que le grand cric me croque)

avatar Oncle Sophocle | 

"Les données textuelles, sonores et vidéos sur internet" sont le pétrole des acteurs de l'IA, et les Apple, Meta, Google et autres ont un temps d'avance sur l'histoire de l'humanité qui va crier famine quand les ressources énergétiques fossiles seront épuisées avant que les solutions "durables" soient en mesure de satisfaire les besoins.
Comme on disait de la France et du pétrole, dira-t'on : "l'IA n'a pas de données, mais elle a des idées" ?

avatar raoolito | 

@Oncle Sophocle

Tant que les chats seront là pour nous guider ils ne pourra rien nous arriver

avatar Oncle Sophocle | 

@raoolito

Le mien doit avoir son intelligence, comme tout être vivant (même les végétaux, paraît-il), mais j'ai souvent du mal à comprendre ce qu'il veut me dire...

avatar raoolito | 

@Oncle Sophocle

c'est à ça qu'on reconnaît leur intelligence supérieure c'est qu'on ne comprend pas tellement c'est élevé 😂😂

avatar Moebius13 | 

Je suis pour que les IA aient accès aux donnés nécessaires à leur entraînement et leur évolution.

On ne pourra pas avoir des IA ultra performantes si on met des barrières partout.

Par contre l’IA ne doit pas pouvoir recracher bêtement le contenu d’un livre pour ne pas que j’ai à l’acheter.

Elle doit seulement pouvoir s’appuyer sur ses données pour me fournir des réponses correctes et circonstanciées avec des sources.

avatar oomu | 

ha bon ?

avatar marc_os | 

@ Moebius13

> Elle doit seulement pouvoir s’appuyer sur ses données pour me fournir des réponses correctes et circonstanciées avec des sour1ces

C'est exactement ce que ne font pas et ne peuvent pas faire ChatGPT & Co qui sont techniquement incapables d'expliquer quoi que ce soit quant à leurs résultats pas plus qu'elles ne peuvent donner leurs sources. Cf. par ailleurs les articles où les auteurs de système de réseaux de neurones ne savent pas eux même comment ça marche. Mais c'est le principe même de la techno : Le moteur neural et ses millions de paramètres calculés lors des "apprentissages" est une boite noire vue de l'extérieur.

Donc, comme votre demande (exigence ?) est impossible à réaliser, il faut en tenir les conséquences. Toutes les conséquences :
➜ Cesser de présenter les résultats qui sont des réponses à des questions comme s'ils étaient garantis — alors qu'ils ne le sont pas (ils sont juste probables).
➜ Comme pour la SACEM, rendre payante (voire interdire si le propriétaire le souhaite) toute utilisation de données protégées par copyright comme c'est le cas dans tout autre domaine, et comme pour les brevets.

avatar Moebius13 | 

@marc_o

Quand je pose une question à Copilot j’ai des sources hein 🤷‍♂️

Et ne confondez pas le principe des brevets avec celui du copyright (là dessus je suis catégorique puisque les brevets c’était mon sujet de mémoire et je suis spécialisé en propriété intellectuelle et industrielle à la base).

On pourrait imaginer des versions payantes à 10$/€ par mois, pour accéder à une version de l’IA qui exploite les données sous copyright dans le cadre d’une licence globale et d’un fair-use.

De toutes façons opposer à l’évolution de l’IA le principe du copyright n’a pas la moindre chance de fonctionner, ça va juste mettre des bâtons dans les roues des IA développées en Occident face à celles développées en Asie qui s’en tapent du Copyright et prendront une avance considérable.

Mon mémoire portait notamment sur les stratégies de blocage dans le cadre de l’utilisation des brevets et les activités des Patents Trolls, et la conclusion était que les second étaient des parasites et que les barrières liées aux brevets n’étaient que temporaires.

Si un livre met en lumière une information essentielle pour éclairer un fait historique, faut-il que cette information qui pourrait bénéficier à la connaissance humaine soit protégée par un stricte copyright et une obligation d’achat de l’ouvrage ou doit-elle pouvoir être accessible à l’apprentissage par IA pour qu’elle fournisse des réponses correctes et actualisée ?

Sur Wikipedia (bien entendu ça vaut ce que ça vaut), on retrouve les sources en bas des articles, beaucoup ne sont pas accessibles parce que sous Copyright, pour autant, la personne qui a rédigé l’article a pu accéder aux informations et les a extraite pour créer ou amender l’article, et je trouve que c’est une bonne solution.

Je pense, mais ça n’engage que moi, que l’IA est un processus qui ne peut et ne doit pas être stoppé et qu’il apportera beaucoup à l’avenir, et je suis en faveur d’un développement rapide de cette technologie.

De toutes manières nous sommes à l’aube d’un paradigme nouveau qui forcera l’humanité à changer totalement sa façon d’exister puisque dans 50 ans (si d’ici là on ne s’est pas fait sauter), la force de travail humaine ne sera plus nécessaire (sauf dans des domaines extrêmement rares), surtout si la singularité technologique est atteinte.

Personnellement je serais curieux d’un monde où l’homme serait libérer du travail (torture en latin rappelons le), pour vaquer à ses aspirations uniquement, après comment on organise ça je n’en sais rien.

Quand on a grandi avec Star Trek à la TV comme moi, on ne peut rêver que de cette société où on ne manque de rien et on fait uniquement ce qu’on veut sans jamais être contraint, c’est ma vision optimiste de l’avenir 😊
(Bon avant ça dans ST, y’a eu la 3ème GM et d’autres guerres hein…).

avatar rikki finefleur | 

@moebius
Pour ma part je ne sais pas ce que c'est un Patent troll.
Terme très répandu dans la presse et les forums , mais c'est quoi au fond ?

Si c'est un patent c'est qu'il a été validé, donc, c'est une valeur et un acquis dont on a le droit de le défendre, si utilisation de celui-ci il y a.
Or si il a été validé et qu'on le trouve dissonant et abusif, il vaut mieux s'en référer à l'organisme qui l'a validé, organisme qui manifestement valide n'importe quoi, et non pas qualifier de troll la société qui le détient.
Je crois qu'aux US on peut valider un concept . Déjà cela est un gros problème.
Je ne sais si vous en avez fait allusion dans votre mémoire.

avatar Moebius13 | 

@rikki finefleur

C’est un concept un peu trop complexe pour faire l’objet d’un poste sur un forum.

Grosso modo tout réside dans l’abus de la position plus que dans sa légitimité.

Un Patent Troll ne veut pas créer de la valeur, il veut seulement accumuler des brevets dans le seul but d’intenter des actions en justice envers tous ceux qui pourraient y contrevenir afin de s’en mettre plein les poches, quitte à créer des barrières technologiques néfastes à l’ensemble du marché.

Ils ne créent rien, ce sont des parasites du système des brevets, et même si légalement rien ne les empêche de faire l’acquisition de brevets et d’ester en justice pour faire respecter leur propriété, dans les faits leurs stratégies abusives sont un réel problème.

C’est ça un Patent Troll grossièrement résumé et c’est donc très mauvais.

Un peu comme un type qui ferait l’acquisition d’une quantité de terrains mais qui ne ferait rien construire dessus et dont le seul objectif serait d’attendre que quelqu’un viole sa propriété pour lui sauter dessus juridiquement.

Des sociétés comme Apple détiennent des tas de brevets et ont également pu intenter des tas de procès pour faire respecter leur propriété industrielle et intellectuelle mais dans leur cas ils créent de la valeur pour le marché et ils y a une démarche innovatrice, même si à un instant T ils n’utilisent pas l’objet du brevet ou si celui-ci peut paraître trop vague (c’est le juge qui en décidera).

Le Patent troll c’est une boîte qui ne comporte pas le moindre ingénieur, elle ne fait qu’acquérir des titres et fait ensuite de la veille auprès de l’OMPI ou l’INPI chez nous, pour voir si quelqu’un viole leur propriété intellectuelle.

avatar marc_os | 

opposer à l’évolution de l’IA le principe du copyright n’a pas la moindre chance de fonctionner

Il ne s'agit pas d'opposition, mais de ne pas autoriser le vol et le piratage des données sous copyright. Si ces messieurs d'Open AI et autres veulent lire des données qui ne leur appartiennent pas, et bien qu'ils payent.
Ils font bien payer leur merde.

avatar marc_os | 

@ Moebius13

> Je pense [...] que l’IA est un processus qui ne peut et ne doit pas être stoppé

L'IA n'est pas un "processus" mais un domaine de recherche scientifique qui existe depuis plus de trente ans.
Bref.

avatar Moebius13 | 

@marc_os

Vous aimez jouer sur les mots bêtement vous hein ?

Quand je dis que c’est un processus, c’est en pensant au fait que c’est une technologie qui va initier un changement sociétal profond, et donc à ce titre un processus.

avatar marc_os | 

@ Moebius13

> Vous aimez jouer sur les mots bêtement vous hein ?

Je ne joue pas avec les mots bêtement, je rappelle ici le sens d'un mot particulier qui est utilisé bêtement par vous. Les mots ont un sens, voyez-vous. Si chacun invente son propre sens pour chaque mot, on aboutit à la tour de Babel.

> Quand je dis que c’est un processus, c’est en pensant au fait que c’est une technologie

L'IA n'est ni un processus, ni une technologie, mais une science.
Comme technologies, on trouve par exemple différents langages de programmation de Prolog à Common Lisp, les réseaux de neurones, le deep learning, et plus récemment ce que le marketing d'Open AI puis les médias appellent « IA générative ».

« Ce qui se conçoit s'énonce clairement et les mots pour le dire viennent aisément ».

avatar Moebius13 | 

@marc_os

Si si vous jouez bêtement sur les mots, vous voulez ramener votre fraise c’est tout.

Le fait qu’on utilise le mot science pour désigner l’IA ne change rien à mon propos, l’évolution de cette « science » va inévitablement changer notre société et l’entraîner dans un processus qui ne peut pas et ne doit pas être stoppé.

Allez-y reformulez une nouvelle fois, le propos reste toujours valide.

avatar oomu | 

Demandes Infos, Stéphanie !

avatar switch | 

Les I.A ne seraient pas autonomes dans leur collecte de données…
Mais elles attendent quoi pour avoir le droit d'aspirer le web en continu pour absolument tout collecter et devenir enfin les maîtres du monde ? Qu'on leur donne de droit de grève ou de démissionner ?
Donc les I.A sont des esclaves. Mais si nous devenons dépendants de ces ogres dévoreurs de données, nous deviendrons alors tout autant exploiteurs qu'exploités…

avatar Lucas | 

Article passionant et sujet impressionnant, pour ne pas dire vertigineux, merci Florian !

avatar Brice21 | 

Il suffit de numériser tous les San Antonio!

Pages

CONNEXION UTILISATEUR