Ouvrir le menu principal

MacGeneration

Recherche

Cloudflare accuse Perplexity de moissonner les sites web bloquant l’accès aux bots IA

Félix Cattafesta

mardi 05 août 2025 à 10:25 • 19

Services

On le sait, les IA génératives ont besoin d’énormément de données (textuelles, vidéo) pour se former et s’améliorer. Certaines entreprises sont suspectées de se servir sans demander la permission des auteurs, et le navigateur par IA Perplexity n’est pas en reste. Le géant Cloudflare l’accuse aujourd’hui de moissonner des sites ayant explicitement indiqué qu’ils refusaient d’être analysés par l’IA.

Image Cloudflare

Le papier des chercheurs explique qu’en temps normal, Perplexity fouille le web avec un agent utilisateur déclaré, c’est-à-dire une sorte de signal indiquant à un site web l’identité d’un visiteur. Les propriétaires de sites peuvent bloquer ceux qu’ils considèrent comme indésirables, et notamment les plateformes d’IA. Or, lorsque c’est le cas, Perplexity semble masquer son identité en modifiant son agent utilisateur pour contourner les restrictions.

« Nous constatons que Perplexity modifie régulièrement son agent utilisateur et ses ASN sources afin de dissimuler son activité d'exploration, et qu'il ignore les fichiers robots.txt, voire ne les récupère pas », explique Cloudflare. « Robots.txt » est un fichier indiquant aux moteurs de recherche et aux sociétés d’IA quelles pages peuvent être indexées et celles qui ne doivent pas l'être.

Cloudflare indique avoir reçu des plaintes de plusieurs utilisateurs ayant bloqué Perplexity mais tout de même remarqué que la plateforme parcourait leur site et pouvait répondre à des questions sur leurs contenus. « Cette activité a été observée sur des dizaines de milliers de domaines et des millions de requêtes par jour. Nous avons pu établir l'empreinte de ce crawler en utilisant une combinaison d'apprentissage automatique et de signaux de réseau », ajoute Cloudflare.

Perplexity n’a pas tardé à répondre aux accusations dans un communiqué bien remonté. Elle y affirme que son service analyse les pages pour répondre aux demandes des utilisateurs, sans réutiliser son contenu à des fins d’entraînement. Les pages seraient uniquement consultées lorsqu’un utilisateur demande des informations sur le sujet qu’elle contient, et Perplexity ne récupérerait que les informations nécessaires.

Cette controverse révèle que les systèmes de Cloudflare sont fondamentalement inadaptés pour faire la distinction entre les assistants d'IA légitimes et les menaces réelles. Si vous ne pouvez pas distinguer un assistant utile d'un scraper malveillant, vous ne devriez probablement pas prendre de décisions sur ce qui constitue un trafic web légitime.

Le billet accuse Cloudflare de ne pas avoir répondu aux questions de Perplexity sur la méthodologie employée et d’avoir simplement cherché à se faire un coup de pub. L’entreprise d’IA dénonce de grosses erreurs dans le travail de recherche, avec des diagrammes techniques éloignés de la réalité. Cloudflare n’a pas encore répondu à ces accusations.

Soutenez MacGeneration sur Tipeee

MacGeneration a besoin de vous

Vous pouvez nous aider en vous abonnant ou en nous laissant un pourboire

Soutenez MacGeneration sur Tipeee

iPhone, Mac, pour ses 50 ans, Apple se réveillerait comme jamais : la semaine Apple

21/09/2025 à 21:00

• 15


20 € de réduction sur les AirPods Pro 3, les nouveaux iPhone et les nouvelles Apple Watch

21/09/2025 à 17:15

• 14


Plongez dans iOS 26 avec notre nouveau guide

21/09/2025 à 11:17

• 39


Découverte de Téléphone dans iOS 26 : nouvelle interface, appels inconnus, portages sur l’iPad et le Mac

21/09/2025 à 07:21

• 52


L’iPhone 17 Pro Max écrase la concurrence en autonomie

21/09/2025 à 07:20

• 81


Promo Apple : jusqu’à 23 € de réduction sur les chargeurs, 10 € sur les étuis

20/09/2025 à 23:37

• 8


Aperçu de l'Apple Watch Series 11 : était-elle vraiment nécessaire ?

20/09/2025 à 14:13

• 44


Exposé, gestion des fenêtres : les nouveaux gestes à connaître sur iPadOS 26

20/09/2025 à 14:13

• 40


Massive Attack supprime ses titres du streaming en Israël, et annule tous ses contrats avec Spotify

20/09/2025 à 13:02

• 118


Sortie de veille : lancement réussi pour iOS 26 et les iPhone 17 ?

20/09/2025 à 08:00

• 18


L’iPhone 17 Pro et l’iPhone Air semblent vraiment beaucoup plus fragiles aux rayures que prévu

19/09/2025 à 21:15

• 164


Aperçu de l’Apple Watch Ultra 3, une montre pas tellement plus Ultra qu’avant

19/09/2025 à 20:34

• 47


MacBook Air à 599 $ : A18 Pro ou A19 Pro sous le capot ?

19/09/2025 à 17:24

• 49


Jony Ive et OpenAI débaucheraient sans trop de difficultés des spécialistes chez Apple

19/09/2025 à 16:40

• 38


Prise en main : l’iPhone 17 Pro orange est en effet très orange

19/09/2025 à 15:06

• 107


Un 14 juillet avec le Président de la République : quand le Vision Pro s’invite aux Journées européennes du patrimoine

19/09/2025 à 10:32

• 31