Partenariat entre Stack Overflow et OpenAI : des opposants sabotent leurs publications

Stéphane Moussie |

Stack Overflow et OpenAI ont annoncé la semaine dernière un partenariat qui prévoit que la mine d’informations du premier nourrisse les technologies d’IA génératives du second. Cet accord suscite la controverse au sein de la communauté de la plateforme et une fronde est en train de s’organiser.

Stack Overflow est une plateforme d’entraide incontournable pour les développeurs : ils peuvent y poser leurs questions techniques dans l’espoir que des confrères leur apportent des solutions ou des explications. Depuis son lancement en 2008, ce grand forum a accumulé une énorme base de connaissances, une base qui s’apprête donc à alimenter ChatGPT.

« Je déteste ça. Je vais juste supprimer/défigurer mes réponses une par une, a écrit un utilisateur sur Stack Exchange, un site appartenant au même groupe. Je me fiche que cela soit contraire à vos politiques ridicules, car comme le montre cette annonce, vos politiques peuvent changer à tout moment sans consultation préalable de vos parties prenantes. Vous ne vous souciez pas de vos utilisateurs, je ne me soucie pas de vous. »

Alors que certains utilisateurs ont tenté de saboter leurs publications, le personnel de Stack Overflow aurait banni une partie des frondeurs. Un utilisateur raconte qu’après avoir remplacé plusieurs de ses réponses bien notées sur la plateforme par un message de protestation, son compte a été suspendu pendant sept jours.

Stack Overflow est pris entre le marteau et l’enclume. Depuis l’émergence de ChatGPT et Copilot, deux nouvelles technologies capables d’épauler efficacement les développeurs, la plateforme a vu son trafic diminuer. Le contrat passé avec OpenAI doit sûrement lui rapporter de l’argent frais, mais dans le même temps il donne du carburant à sa principale menace.

L’accord stipule que ChatGPT attribuera à Stack Overflow les réponses issues de sa communauté, mais cette visibilité sera-t-elle suffisante pour compenser la baisse des visites ? Le partenariat prévoit également l’utilisation par Stack Overflow des modèles d’OpenAI pour développer de nouveaux produits.

Les IA crient famine dans leur recherche de nouvelles données à moissonner

Les IA crient famine dans leur recherche de nouvelles données à moissonner

avatar R-APPLE-R | 

OpenAI est partout aujourd’hui je suis d’ailleurs étonné que Apple fasse affaire avec sauf si le modèle de langage soit uniquement sur les serveurs d’Apple et qui ne stocke pas les données utilisateurs
Je vois bien un Siri sur l’appareil en local donc avec sont propre LLM et une connexion au serveur d’Apple avec GPT dessus 😈

avatar valcapri | 

@R-APPLE-R

Si tu passe par l’API rien n’est normalement stocké. Ce n’est que si tu passe par ChatGPT que c’est stocké et encore tout dépend du plan utilisé (il me semble que pour le plan Teams rien n’est stocké pour un entraînement).

Mais si semblerais que si il se nourrit de lui-même, cela risque de lui faire plus de tord que de bien. Donc à moins d’avoir des humains qui corrige les réponses et les erreurs que l’on essaye de lui faire comprendre que ce n’est pas correct.

Je l’ai testé encore ce week-end avec du code, et il a tendance à inventer des API qui n’existe pas. Tu as beau lui dire, il recherche dans la même direction.

Je l’aime bien comme petit canard «  rubber duck » pour lui expliquer mes problèmes de code et qu’il m’aide. Mais pour plus, on ne peut pas vraiment lui faire confiance.

avatar Sylvain63140 | 

@valcapri

Ta réponse sur le problème de pertinence des réponses et l’article est amusante. Car elle souligne le manque de confiance de retour sur Chatgpt. Et de fait il lui faut plus de connaissances. Mais pour cela il faut que les personnes, qui l’utilisent, acceptent (ou pas) que leurs savoirs soit avalés, sans contrepartie. Afin d’avoir des réponses pertinentes quand elles le questionneront.
Il va être intéressant de voir comment cela va évoluer.
Mais je ne me fais pas trop d’illusions. Après Microsoft et Facebook, Chatgpt va devenir le vilain petit (gros) canard 🦆 que tout le monde montrera de doigt.
Je constate de plus en plus chaque jours….. finalement le produit vraiment c’est nous.

avatar v1nce29 | 

Dans l'absolu est-ce que OpenAI est tenu de contracter avec SO vu que le contenu est CC-BY-SA4 ?

avatar R-APPLE-R | 

@v1nce29

Il suffit de demander à ChatGPT lui même : Ce commentaire semble questionner si OpenAI est légalement obligé de contracter avec SO (Stack Overflow) en raison de la licence CC-BY-SA4 (Creative Commons Attribution-ShareAlike 4.0). La licence CC-BY-SA4 permet la réutilisation du contenu, mais elle peut impliquer certaines obligations, notamment celle de partager le contenu dérivé sous la même licence. Cependant, cela ne signifie pas nécessairement qu'OpenAI est obligé de contracter avec SO pour utiliser le contenu. Les détails spécifiques dépendent des termes de la licence et des accords entre les parties impliquées 😈

avatar Mac1978 | 

Le problème soulevé est vraiment intéressant.

La base de connaissances est alimentée par des humains, à ma connaissance non rémunérés. Mais la mise à disposition de ces connaissances coûte (serveurs, infrastructure, logiciels) et StackOverflow doit donc se financer, via de la pub pour les comptes « gratuits », des abonnements, voire des solutions pour entreprises.

Le financement diminue à cause de l’IA alimentée par d’autres sources, mais OpenAI est d’accord de payer pour accéder à la base de connaissances, qui du coup augmentera moins vite, voire in fine plus du tout.

Le modèle économique ne devrait-il pas être repensé ? À savoir, rémunérer les humains qui augmentent la base de connaissances, et par exemple aussi ceux qui notent la pertinence du code fourni par l’IA, parce que ce n’est pas toujours du 18 carats…

avatar Kwikyyy | 

Le but même de SO c’est de contribuer sans se faire payer mais en même temps… je me demande si les personnes en questions saboteraient leurs publications si elles recevaient une paie. Peut être que rémunérer est la solution ?

avatar Fredouille14 | 

On mesure les limitations du modèle, l’IA se nourrit de données qui ne vont plus aussi bien se renouveler dans certains domaines

avatar marc_os | 

« Le partenariat prévoit également l’utilisation par Stack Overflow des modèles d’OpenAI pour développer de nouveaux produits »

Quels produits ?
Ils veulent faire comme Ikea et proposer tout et n'importe quoi en oubliant leur cœur de métier au risque de finir par le négliger, comme ça, juste parce que ?

Pour moi ça ressemble à une embrouille d'OpenAI, genre "échange", alors qu'en vérité le flux d'information ira essentiellement de StackOverflow vers OpenAI et non pas l'inverse.

avatar marc_os | 

Que disent les règles de droits d'auteur à ce sujet ?

CONNEXION UTILISATEUR