Ouvrir le menu principal

MacGeneration

Recherche

Cloudflare accuse Perplexity de moissonner les sites web bloquant l’accès aux bots IA

Félix Cattafesta

mardi 05 août 2025 à 10:25 • 19

Services

On le sait, les IA génératives ont besoin d’énormément de données (textuelles, vidéo) pour se former et s’améliorer. Certaines entreprises sont suspectées de se servir sans demander la permission des auteurs, et le navigateur par IA Perplexity n’est pas en reste. Le géant Cloudflare l’accuse aujourd’hui de moissonner des sites ayant explicitement indiqué qu’ils refusaient d’être analysés par l’IA.

Image Cloudflare

Le papier des chercheurs explique qu’en temps normal, Perplexity fouille le web avec un agent utilisateur déclaré, c’est-à-dire une sorte de signal indiquant à un site web l’identité d’un visiteur. Les propriétaires de sites peuvent bloquer ceux qu’ils considèrent comme indésirables, et notamment les plateformes d’IA. Or, lorsque c’est le cas, Perplexity semble masquer son identité en modifiant son agent utilisateur pour contourner les restrictions.

« Nous constatons que Perplexity modifie régulièrement son agent utilisateur et ses ASN sources afin de dissimuler son activité d'exploration, et qu'il ignore les fichiers robots.txt, voire ne les récupère pas », explique Cloudflare. « Robots.txt » est un fichier indiquant aux moteurs de recherche et aux sociétés d’IA quelles pages peuvent être indexées et celles qui ne doivent pas l'être.

Cloudflare indique avoir reçu des plaintes de plusieurs utilisateurs ayant bloqué Perplexity mais tout de même remarqué que la plateforme parcourait leur site et pouvait répondre à des questions sur leurs contenus. « Cette activité a été observée sur des dizaines de milliers de domaines et des millions de requêtes par jour. Nous avons pu établir l'empreinte de ce crawler en utilisant une combinaison d'apprentissage automatique et de signaux de réseau », ajoute Cloudflare.

Perplexity n’a pas tardé à répondre aux accusations dans un communiqué bien remonté. Elle y affirme que son service analyse les pages pour répondre aux demandes des utilisateurs, sans réutiliser son contenu à des fins d’entraînement. Les pages seraient uniquement consultées lorsqu’un utilisateur demande des informations sur le sujet qu’elle contient, et Perplexity ne récupérerait que les informations nécessaires.

Cette controverse révèle que les systèmes de Cloudflare sont fondamentalement inadaptés pour faire la distinction entre les assistants d'IA légitimes et les menaces réelles. Si vous ne pouvez pas distinguer un assistant utile d'un scraper malveillant, vous ne devriez probablement pas prendre de décisions sur ce qui constitue un trafic web légitime.

Le billet accuse Cloudflare de ne pas avoir répondu aux questions de Perplexity sur la méthodologie employée et d’avoir simplement cherché à se faire un coup de pub. L’entreprise d’IA dénonce de grosses erreurs dans le travail de recherche, avec des diagrammes techniques éloignés de la réalité. Cloudflare n’a pas encore répondu à ces accusations.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

Fin de Windows 10 : et si vous remplaciez votre PC par un Mac ?

20:30

• 5


macOS Tahoe 26.2 bêta 1 enfin disponible au téléchargement

20:07

• 1


Le Black Friday commence chez Proton : Mail à 1,99 €, VPN à 2,49 €, Unlimited à 6,49 € 🆕

19:10

• 34


Renault dévoile sa nouvelle Twingo, électrique et néo-retro, promise à moins de 20 000 €

18:15

• 107


Comment gagner (un peu) de place sur un Mac Apple Silicon en supprimant le code Intel

17:55

• 15


La nouvelle intro d’Apple TV a été créée à la main, avec du verre et des lumières

17:12

• 30


La Fnac, Darty et Amazon étendent les délais de retour jusqu'à fin janvier 2026, vous pouvez prévoir les cadeaux

16:00

• 4


Grosses promotions (jusqu'à 26 %) sur des MacBook Pro, iMac et iPad mini : il va falloir choisir !

14:57

• 13


Un accessoire pratique pour faire du câble management

13:55

• 0


Mais où est la version bêta de macOS 26.2 ?

12:50

• 2


OmniOutliner 6 va passer à l’achat universel et adopte Liquid Glass

11:45

• 12


Le Freebox Révolution Light repasse à 30 €/mois, après une promotion à 20 €/mois cet été

11:45

• 3


Apple a vraiment envie que vous réessayiez les résumés des notifications fournis par Apple Intelligence

10:37

• 27


macOS Tahoe 26.1 : des correctifs importants pour l’audio

08:36

• 3


Profitez vite de Microsoft Office 2021 à vie pour Mac ou Windows à partir de 30,11 € 📍

08:20

• 0


Le MacBook Air M2 est à son prix le plus bas sur Amazon, avec 16 Go de RAM 🆕

08:10

• 55