Ouvrir le menu principal

MacGeneration

Recherche

Un million de messages aspirés sur Bluesky par un développeur un peu trop enthousiaste

Greg Onizuka

mercredi 27 novembre 2024 à 22:00 • 43

Services

Alors que certains services comme 𝕏 ou Facebook sont maintenant connus pour utiliser les données de leurs utilisateurs pour entraîner leurs Intelligences Artificielles respectives, Bluesky (dont le succès commence à faire du bruit) a de son côté décidé de laisser tranquille ses clients et de ne pas participer à cette goinfrerie d’IA... mais c’était sans compter sur certains développeurs.

Si l’entreprise en elle-même assure ne pas vouloir utiliser les données produites par ses usagers, il est une chose contre laquelle elle ne peut pas faire grand chose : les bots qui aspirent les données de divers sites web automatiquement. En principe, le fait de placer un fichier « robots.txt » bien configuré devrait prévenir ce genre de pratiques, mais un développeur mal intentionné ou n’ayant que peu d’éthique peut très bien passer outre ce fichier et décider de quand même aspirer les données.

Le cas du jour, relaté par 404Media, est cependant l’exemple même de l’outil qui se retourne contre son créateur : Bluesky a en effet créé une API permettant de récupérer les messages, le compte les ayant postés, l’horodatage de ceux-ci ainsi que quelques autres métadonnées statistiques. Un développeur peu scrupuleux n’a eu qu’à utiliser l’outil pour récupérer un million de messages. Pire, sa base de données étant un instantané de ce qui était sur le réseau social à un instant T, certains des messages contenus ne sont plus en ligne, ayant été effacés par leurs auteurs.

Si l'intention première du développeur était de montrer qu'il était facile de nourrir les IA grâce aux réseaux sociaux, l’affaire commençant à faire du bruit et remontant aux responsables de Bluesky, il a ensuite supprimé la base de données qu’il avait créée, afin de mettre fin au bad buzz qui grandissait parmi les utilisateurs du site.

Au final, cette affaire rappelle que quelles que soient les bonnes intentions affichées par un réseau social, il existera toujours un moyen de récupérer les informations publiées en ligne par les utilisateurs, ou même de conserver des messages qui ont pourtant été effacés par ceux-ci. Si Bluesky après cette affaire confirme travailler à l’idée de laisser le choix à ses clients d’accepter ou non que leurs données soient utilisées par des tiers, l’entreprise ne pourra jamais empêcher des développeurs manquant d’éthique de récupérer tout ce qui pourrait leur sembler utile sur le réseau, les messages étant par essence accessibles à tous.

Près de 25 € de réduction sur les dernières roulettes de Mac Pro

17/04/2026 à 18:00

• 11


Adobe annonce Firefly AI Assistant, un « agent créatif » qui prend le contrôle des apps du Creative Cloud

17/04/2026 à 17:37

• 13


Microsoft va (vraiment) abandonner une vieille limite arbitraire de FAT32, qu'Apple n'a jamais appliquée

17/04/2026 à 17:05

• 10


Stan Ng, qui a porté le marketing de l’iPod à l’Apple Watch, part à la retraite

17/04/2026 à 15:52

• 1


Une offre pour votre Apple TV : Canal+ ressort son pack « 100% » à 19,99 €

17/04/2026 à 15:49

• 48


Le MacBook Neo pourrait prendre 36 € à cause de la taxe sur la copie privée, jusqu'à 14 € de plus pour les iPhone et iPad

17/04/2026 à 15:00

• 139


Bouygues, Free et Orange en négociations exclusives avec Altice pour racheter SFR

17/04/2026 à 12:51

• 54


Complications ou rafraîchissement : qu'est-ce qui vide vraiment votre Apple Watch ?

17/04/2026 à 12:51

• 22


Apple Store : 10 % de réduction sur un accessoire en faisant recycler un iPhone ou un autre appareil

17/04/2026 à 12:44

• 6


Des anciens d'Apple fondent une start-up pour concevoir les CPU du futur, Nuvacore

17/04/2026 à 12:10

• 17


Concours : gagnez un écran BenQ, des chaises de bureau Sihoo et des abonnements au Club iGen

17/04/2026 à 10:55

• 19


OpenAI renforce Codex, Anthropic déploie Opus 4.7 et Perplexity lance Personal Computer

17/04/2026 à 10:54

• 20


Vous trouvez le Thunderbolt 5 trop lent ? Le CopprLink permet 512 Gb/s

17/04/2026 à 10:20

• 14


M5 Pro : l’insolente supériorité d’Apple Silicon face au futur d’Intel

17/04/2026 à 09:24

• 36


MacBook Neo : les délais de livraison s'envolent sur l'Apple Store

17/04/2026 à 08:31

• 24


iPhone : vers une communication plus cool ?

16/04/2026 à 21:45

• 21