Ouvrir le menu principal

MacGeneration

Recherche

Cloudflare accuse Perplexity de moissonner les sites web bloquant l’accès aux bots IA

Félix Cattafesta

mardi 05 août 2025 à 10:25 • 19

Services

On le sait, les IA génératives ont besoin d’énormément de données (textuelles, vidéo) pour se former et s’améliorer. Certaines entreprises sont suspectées de se servir sans demander la permission des auteurs, et le navigateur par IA Perplexity n’est pas en reste. Le géant Cloudflare l’accuse aujourd’hui de moissonner des sites ayant explicitement indiqué qu’ils refusaient d’être analysés par l’IA.

Image Cloudflare

Le papier des chercheurs explique qu’en temps normal, Perplexity fouille le web avec un agent utilisateur déclaré, c’est-à-dire une sorte de signal indiquant à un site web l’identité d’un visiteur. Les propriétaires de sites peuvent bloquer ceux qu’ils considèrent comme indésirables, et notamment les plateformes d’IA. Or, lorsque c’est le cas, Perplexity semble masquer son identité en modifiant son agent utilisateur pour contourner les restrictions.

« Nous constatons que Perplexity modifie régulièrement son agent utilisateur et ses ASN sources afin de dissimuler son activité d'exploration, et qu'il ignore les fichiers robots.txt, voire ne les récupère pas », explique Cloudflare. « Robots.txt » est un fichier indiquant aux moteurs de recherche et aux sociétés d’IA quelles pages peuvent être indexées et celles qui ne doivent pas l'être.

Cloudflare indique avoir reçu des plaintes de plusieurs utilisateurs ayant bloqué Perplexity mais tout de même remarqué que la plateforme parcourait leur site et pouvait répondre à des questions sur leurs contenus. « Cette activité a été observée sur des dizaines de milliers de domaines et des millions de requêtes par jour. Nous avons pu établir l'empreinte de ce crawler en utilisant une combinaison d'apprentissage automatique et de signaux de réseau », ajoute Cloudflare.

Perplexity n’a pas tardé à répondre aux accusations dans un communiqué bien remonté. Elle y affirme que son service analyse les pages pour répondre aux demandes des utilisateurs, sans réutiliser son contenu à des fins d’entraînement. Les pages seraient uniquement consultées lorsqu’un utilisateur demande des informations sur le sujet qu’elle contient, et Perplexity ne récupérerait que les informations nécessaires.

Cette controverse révèle que les systèmes de Cloudflare sont fondamentalement inadaptés pour faire la distinction entre les assistants d'IA légitimes et les menaces réelles. Si vous ne pouvez pas distinguer un assistant utile d'un scraper malveillant, vous ne devriez probablement pas prendre de décisions sur ce qui constitue un trafic web légitime.

Le billet accuse Cloudflare de ne pas avoir répondu aux questions de Perplexity sur la méthodologie employée et d’avoir simplement cherché à se faire un coup de pub. L’entreprise d’IA dénonce de grosses erreurs dans le travail de recherche, avec des diagrammes techniques éloignés de la réalité. Cloudflare n’a pas encore répondu à ces accusations.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Luxshare, partenaire industriel majeur d’Apple, victime d’une fuite de données

23:15

• 0


Siri : interactions avec les données dans iOS 26.4, mais le chatbot complet n’arriverait qu’avec iOS 27 et sur serveurs Google

22:01

• 19


Nvidia prise à utiliser des œuvres piratées pour entraîner son IA

21:15

• 9


MacUpdater est à l’arrêt et les alternatives sont loin d’être à jour

19:27

• 31


Volkswagen détrône Tesla et devient numéro un de l’électrique en Europe en 2025

17:39

• 53


Acrobat Studio génère des présentations et des podcasts à partir de PDF

15:47

• 5


Airbnb confirme qu’Apple travaillait bien sur une voiture, si vous en doutiez encore

15:25

• 15


Offrez-vous un Mac mini M2 pour 360 € (code SOLDES20)

15:15

• 0


Promos : l'iPhone 16e à 499 €, l'iPhone 17 à 839 € et les AirPods Pro 3 à 212 €

14:52

• 13


Il confie son MacBook Pro 2018 pour la batterie, Apple lui donne un modèle M4 ! La belle histoire du jour !

13:26

• 104


Xavier Niel rêverait de l’Élysée en 2027, selon sa fille

12:12

• 108


ChatGPT commence à essayer de deviner l’âge de ses utilisateurs, sauf en Europe pour le moment

10:11

• 27


AirPods Pro : un modèle « Ultra » pour la fin de l'année ?

07:58

• 30


Grosse panne dans la nuit pour les services Apple

06:35

• 33


Test de l’ALPSTUGA d’IKEA : un capteur de qualité d’air complet et pas cher, mais décevant dans Maison

06:07

• 35


Les publicitaires échouent à faire interdire l’encadrement du pistage sur iOS

06:07

• 26