Ouvrir le menu principal

MacGeneration

Recherche

Cloudflare accuse Perplexity de moissonner les sites web bloquant l’accès aux bots IA

Félix Cattafesta

mardi 05 août 2025 à 10:25 • 19

Services

On le sait, les IA génératives ont besoin d’énormément de données (textuelles, vidéo) pour se former et s’améliorer. Certaines entreprises sont suspectées de se servir sans demander la permission des auteurs, et le navigateur par IA Perplexity n’est pas en reste. Le géant Cloudflare l’accuse aujourd’hui de moissonner des sites ayant explicitement indiqué qu’ils refusaient d’être analysés par l’IA.

Image Cloudflare

Le papier des chercheurs explique qu’en temps normal, Perplexity fouille le web avec un agent utilisateur déclaré, c’est-à-dire une sorte de signal indiquant à un site web l’identité d’un visiteur. Les propriétaires de sites peuvent bloquer ceux qu’ils considèrent comme indésirables, et notamment les plateformes d’IA. Or, lorsque c’est le cas, Perplexity semble masquer son identité en modifiant son agent utilisateur pour contourner les restrictions.

« Nous constatons que Perplexity modifie régulièrement son agent utilisateur et ses ASN sources afin de dissimuler son activité d'exploration, et qu'il ignore les fichiers robots.txt, voire ne les récupère pas », explique Cloudflare. « Robots.txt » est un fichier indiquant aux moteurs de recherche et aux sociétés d’IA quelles pages peuvent être indexées et celles qui ne doivent pas l'être.

Cloudflare indique avoir reçu des plaintes de plusieurs utilisateurs ayant bloqué Perplexity mais tout de même remarqué que la plateforme parcourait leur site et pouvait répondre à des questions sur leurs contenus. « Cette activité a été observée sur des dizaines de milliers de domaines et des millions de requêtes par jour. Nous avons pu établir l'empreinte de ce crawler en utilisant une combinaison d'apprentissage automatique et de signaux de réseau », ajoute Cloudflare.

Perplexity n’a pas tardé à répondre aux accusations dans un communiqué bien remonté. Elle y affirme que son service analyse les pages pour répondre aux demandes des utilisateurs, sans réutiliser son contenu à des fins d’entraînement. Les pages seraient uniquement consultées lorsqu’un utilisateur demande des informations sur le sujet qu’elle contient, et Perplexity ne récupérerait que les informations nécessaires.

Cette controverse révèle que les systèmes de Cloudflare sont fondamentalement inadaptés pour faire la distinction entre les assistants d'IA légitimes et les menaces réelles. Si vous ne pouvez pas distinguer un assistant utile d'un scraper malveillant, vous ne devriez probablement pas prendre de décisions sur ce qui constitue un trafic web légitime.

Le billet accuse Cloudflare de ne pas avoir répondu aux questions de Perplexity sur la méthodologie employée et d’avoir simplement cherché à se faire un coup de pub. L’entreprise d’IA dénonce de grosses erreurs dans le travail de recherche, avec des diagrammes techniques éloignés de la réalité. Cloudflare n’a pas encore répondu à ces accusations.

illustration ulule

Pour les 50 ans d’Apple, MacGeneration publie un livre événement

Précommandez-le dès maintenant et profitez-en pour découvrir nos nouveaux goodies, ou prolonger votre abonnement au Club iGen à tarif réduit.

Découvrez nos offres

Précommandez le livre et rejoignez la fête

Un livre pour raconter 50 ans d'Apple, une journée à Lyon pour les célébrer ensemble.

Participez sur Ulule

Pourquoi les lunettes connectées ne détrôneront sans doute pas le smartphone

12:18

• 20


Safari 26.4 apporte de nombreuses nouveautés aux créateurs de sites web

11:47

• 5


La guerre des prix sur les produits Apple est lancée entre Joybuy et Amazon

11:21

• 9


Mahsa Alert : l’app que personne ne devrait avoir à installer

09:48

• 23


Honda rétrograde sur l'électrique et envoie à la casse la voiture imaginée avec Sony

08:38

• 65


Portrait d’un « Apple Pin » : à quoi faut-il s’attendre pour le futur compagnon de l’iPhone ?

08:21

• 25


Web mobile : Android met Safari dans le rétroviseur

08:21

• 17


Le Launchpad est mort, mais Apple veut bloquer les clones

06:45

• 63


50 ans d’Apple : J-7 pour commander notre livre (et gagner un MacBook Neo pas comme les autres)

06:04

• 28


25 ans de Mac OS X : de 10.0 à 10.2, l’ère des pionniers

25/03/2026 à 22:31

• 30


macOS 26.4 ajoute un avertissement au moment de copier une commande inconnue dans le Terminal

25/03/2026 à 21:35

• 6


Test de l’iPad Air M4 : le milieu de gamme qui s’essouffle

25/03/2026 à 20:30

• 11


Freebox Révolution : pour éviter que l’afficheur ne tombe en panne, Free propose de l’éteindre

25/03/2026 à 18:46

• 11


Apple a mis à jour les Studio Display avec « displayOS » 26.4 : un firmware de 2,2 Go pour un écran

25/03/2026 à 18:45

• 28


Apple pourrait distiller Gemini pour alimenter le nouveau Siri

25/03/2026 à 17:26

• 55


App Store Connect muscle ses outils d’analyse avec plus de 100 nouvelles données

25/03/2026 à 16:28

• 0