Publicité ciblée : les cookies, c'est dépassé

Anthony Nelzin-Santos |
On le sait : la publicité ciblée fait un grand usage des cookies pour tracer l'historique de navigation de l'utilisateur et lui fournir des annonces toujours plus en rapport avec ses préférences personnelles (lire : « Don't be evil » : le système publicitaire Google à l'épreuve des réseaux sociaux). Jacqui Cheng d'Ars Technica survole une méthode encore plus retorse pour le faire : l'utilisation des bases de données locales dans les navigateurs récents.

Les équipes du projet WebKit utilisent depuis trois ans la spécification Web SQL : comme son nom l'indique, cette spécification proche de SQLite est un format de base de données permettant de stocker des données côté client. Dit plus simplement, c'est ce qui permet à certaines webapps de fonctionner même en l'absence de connexion Internet active, en utilisant les données stockées chez l'utilisateur. Web SQL est utilisé par Safari (Mac, PC et iOS), Chrome et Opera. Internet Explorer 8 et 9 utilisent un système similaire, Web Storage, proposé au W3C.

Le problème est l'utilisation de cet espace de stockage à des fins de ciblage publicitaire. Une régie comme Ringleader Digital utilise par exemple un Ring Leader Digital Globally Unique ID (RLDGUID) pour identifier un téléphone mobile et stocke des « informations ne permettant pas d'identifier un individu » dans une base Web SQL : « navigateur, informations de session, type d'appareil, opérateur, adresses IP, ID de l'appareil, ID de l'opérateur » et… « sites visités ».

Comme il est possible de désactiver (ou au moins de filtrer) les cookies, il est possible de désactiver l'utilisation de Web SQL dans Safari sur Mac (Préférences > Taille de la base de données > Aucun). Mais ce n'est pas possible sur iOS (ou l'utilisation de webapps et la nécessité de mettre des données en cache est plus fréquente et critique). On peut néanmoins effacer les bases de données RLDGUID, mais dès que l'on visite à nouveau un site utilisant les publicités de Ringleader, de nouvelles bases apparaissent.

Pire encore : il semble que le RLDGUID soit stocké à l'extérieur du téléphone — même si on a effacé toutes les bases, les éventuelles nouvelles bases contiendront le même ID de téléphone, et toutes les connaissances emmagasinées par Ringleader seront à nouveau utilisées pour le ciblage. Même si on demande à Ringleader d'être exclu du ciblage (sur une page d'opt-out), il suffit de mettre à jour son navigateur pour la collecte recommence — et oui, le RLDGUID revient à la charge. Tant que le navigateur n'est pas mis à jour, Ringleader désactive tout ciblage, servant de la pub en rapport avec le contenu, mais pas avec les goûts de l'utilisateur. Mais il y a une condition supplémentaire à ce que cette désactivation reste effective : il faut conserver les bases RLDGUID déjà installées, ce qui permet à tout moment la reprise de la collecte et la récupération de l'identifiant. Il y avait les cookies zombies, voici venir les bases de données zombies.



Ringleader a expliqué à Ars préférer l'utilisation du stockage local aux cookies « parce que certains appareils suppriment les cookies, ou les navigateurs les gèrent mal, ou d'autres appareils désactivent pas défaut les cookies ». Bref, pour s'assurer que l'utilisateur est bel et bien suivi et que Ringleader lui fournir les meilleures publicités possibles, le stockage Web SQL est préféré. D'autres sociétés avaient fait ce choix : Quattro Wireless, depuis rachetée par Apple pour former iAd, utilisait QWAPI, un système très similaire.

La pratique de Ringleader n'est pas beaucoup plus invasive que ne l'est la pratique déjà ancienne de suivi des cookies : elle a cependant un aspect plus systématique qui peut inquiéter. On l'a déjà dit à propos de Google : si le géant de l'Internet se décidait un jour à intégrer ses services les uns aux autres, il aurait la capacité de suivre de la manière la plus efficace du marché les traces d'un internaute, et de lui fournir des publicités ciblées à l'extrême. C'est donc à l'utilisateur de placer le curseur : soit il considère qu'il préfère recevoir de la publicité ciblée et donc pertinente plutôt que le tout-venant ; soit il considère que le suivi systématisé de son historique de navigation par le rapprochement de données éparses est une violation de sa vie privée, et il peut alors mettre en place des mécanismes pour l'empêcher. Tant qu'il le pourra.
Accédez aux commentaires de l'article