Ouvrir le menu principal

MacGeneration

Recherche

Un million de messages aspirés sur Bluesky par un développeur un peu trop enthousiaste

Greg Onizuka

mercredi 27 novembre 2024 à 22:00 • 43

Services

Alors que certains services comme 𝕏 ou Facebook sont maintenant connus pour utiliser les données de leurs utilisateurs pour entraîner leurs Intelligences Artificielles respectives, Bluesky (dont le succès commence à faire du bruit) a de son côté décidé de laisser tranquille ses clients et de ne pas participer à cette goinfrerie d’IA... mais c’était sans compter sur certains développeurs.

Si l’entreprise en elle-même assure ne pas vouloir utiliser les données produites par ses usagers, il est une chose contre laquelle elle ne peut pas faire grand chose : les bots qui aspirent les données de divers sites web automatiquement. En principe, le fait de placer un fichier « robots.txt » bien configuré devrait prévenir ce genre de pratiques, mais un développeur mal intentionné ou n’ayant que peu d’éthique peut très bien passer outre ce fichier et décider de quand même aspirer les données.

Le cas du jour, relaté par 404Media, est cependant l’exemple même de l’outil qui se retourne contre son créateur : Bluesky a en effet créé une API permettant de récupérer les messages, le compte les ayant postés, l’horodatage de ceux-ci ainsi que quelques autres métadonnées statistiques. Un développeur peu scrupuleux n’a eu qu’à utiliser l’outil pour récupérer un million de messages. Pire, sa base de données étant un instantané de ce qui était sur le réseau social à un instant T, certains des messages contenus ne sont plus en ligne, ayant été effacés par leurs auteurs.

Si l'intention première du développeur était de montrer qu'il était facile de nourrir les IA grâce aux réseaux sociaux, l’affaire commençant à faire du bruit et remontant aux responsables de Bluesky, il a ensuite supprimé la base de données qu’il avait créée, afin de mettre fin au bad buzz qui grandissait parmi les utilisateurs du site.

Au final, cette affaire rappelle que quelles que soient les bonnes intentions affichées par un réseau social, il existera toujours un moyen de récupérer les informations publiées en ligne par les utilisateurs, ou même de conserver des messages qui ont pourtant été effacés par ceux-ci. Si Bluesky après cette affaire confirme travailler à l’idée de laisser le choix à ses clients d’accepter ou non que leurs données soient utilisées par des tiers, l’entreprise ne pourra jamais empêcher des développeurs manquant d’éthique de récupérer tout ce qui pourrait leur sembler utile sur le réseau, les messages étant par essence accessibles à tous.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Black Friday Mac : CyberGhost en méga promo (−83 % + 4 mois offerts), plus pour longtemps 📍

10:34

• 0


Fnac : 10 € offerts tous les 100 € d’achat pour les adhérents, y compris sur les produits Apple

10:09

• 4


Le MacBook Air M2 est à son prix le plus bas sur Amazon, avec 16 Go de RAM 🆕

09:40

• 59


Île-de-France : Navigo Annuel et Imagine R sur smartphone au printemps, avant enfin l’arrivée de la carte bancaire ?

09:12

• 30


2026 : la feuille de route d’Apple pour le Mac (et elle est chargée)

09:11

• 16


AirDrop : Apple va-t-il fermer la porte à Android ?

07:00

• 66


Après l’iPhone Pocket, Apple sort un accessoire d’accessibilité pour l’iPhone en partenariat avec une designer industrielle

06:09

• 17


Choisir son écran professionnel : ce qui compte vraiment 📍

20/11/2025 à 23:55

• 0


Une attaque particulièrement bien ficelée cible des utilisateurs Apple

20/11/2025 à 23:45

• 82


Black Friday : le Mac mini M4 avec 1 To de stockage à 949 € aujourd’hui seulement

20/11/2025 à 21:11

• 11


Black Friday : Parallels casse les prix avec plus de 50 % de rabais

20/11/2025 à 21:00

• 13


Le guide 2025 des accessoires Localiser : les meilleurs traqueurs pour tout retrouver

20/11/2025 à 19:36

• 8


Les Pixel 10 de Google partagent des données avec les iPhone via AirDrop 🆕

20/11/2025 à 19:36

• 38


Samsung lance un clavier particulièrement original qui n'est absolument pas un Magic Keyboard avec des touches DeX et IA

20/11/2025 à 18:15

• 17


Avec Nano Banana Pro, Google améliore grandement la génération d’images de Gemini

20/11/2025 à 17:36

• 7


System.css donne un look Système 6 à vos sites web grâce à une simple feuille CSS

20/11/2025 à 16:10

• 6