Alors que certains services comme 𝕏 ou Facebook sont maintenant connus pour utiliser les données de leurs utilisateurs pour entraîner leurs Intelligences Artificielles respectives, Bluesky (dont le succès commence à faire du bruit) a de son côté décidé de laisser tranquille ses clients et de ne pas participer à cette goinfrerie d’IA... mais c’était sans compter sur certains développeurs.
Si l’entreprise en elle-même assure ne pas vouloir utiliser les données produites par ses usagers, il est une chose contre laquelle elle ne peut pas faire grand chose : les bots qui aspirent les données de divers sites web automatiquement. En principe, le fait de placer un fichier « robots.txt » bien configuré devrait prévenir ce genre de pratiques, mais un développeur mal intentionné ou n’ayant que peu d’éthique peut très bien passer outre ce fichier et décider de quand même aspirer les données.
Le cas du jour, relaté par 404Media, est cependant l’exemple même de l’outil qui se retourne contre son créateur : Bluesky a en effet créé une API permettant de récupérer les messages, le compte les ayant postés, l’horodatage de ceux-ci ainsi que quelques autres métadonnées statistiques. Un développeur peu scrupuleux n’a eu qu’à utiliser l’outil pour récupérer un million de messages. Pire, sa base de données étant un instantané de ce qui était sur le réseau social à un instant T, certains des messages contenus ne sont plus en ligne, ayant été effacés par leurs auteurs.
Si l'intention première du développeur était de montrer qu'il était facile de nourrir les IA grâce aux réseaux sociaux, l’affaire commençant à faire du bruit et remontant aux responsables de Bluesky, il a ensuite supprimé la base de données qu’il avait créée, afin de mettre fin au bad buzz qui grandissait parmi les utilisateurs du site.
Au final, cette affaire rappelle que quelles que soient les bonnes intentions affichées par un réseau social, il existera toujours un moyen de récupérer les informations publiées en ligne par les utilisateurs, ou même de conserver des messages qui ont pourtant été effacés par ceux-ci. Si Bluesky après cette affaire confirme travailler à l’idée de laisser le choix à ses clients d’accepter ou non que leurs données soient utilisées par des tiers, l’entreprise ne pourra jamais empêcher des développeurs manquant d’éthique de récupérer tout ce qui pourrait leur sembler utile sur le réseau, les messages étant par essence accessibles à tous.