Une extension Wayback Machine pour Chrome cherche les pages disparues
Internet Archive a sorti il y a quelques jours une extension pour Chrome, capable d'aller puiser dans son stock de pages archivées lorsque vous tombez sur un message d'erreur au gré de vos déambulations sur le web. Les amateurs de Firefox ont également une telle solution.
Le cas le plus courant est l'erreur 404, lorsque la page correspondant à une URL a disparu, mais il en existe beaucoup d'autres qui ont la même conséquence pour l'internaute : une voie sans issue et un contenu disparu.
Lorsque l'extension détectera l'affichage de l'un de ces codes d'erreur, elle ira automatiquement interroger la base de données d'Internet Archive pour voir s'il n'existerait pas une version enregistrée de la page qui figurait à cet endroit.
Avec 20 ans d'activité et, à ce jour, plus de 279 milliards de pages web enregistrées puis archivées il y a peut-être une chance que la page disparu subsiste dans le fond constitué inlassablement par Internet Archive. Cette dernière insiste également sur les questions de confidentialité. L'extension n'exploitera pas votre historique de navigation et l'Internet Archive discute avec Google pour insérer des serveurs proxy de manière à opacifier l'origine des requêtes et les adresses IP.
Et la vie privé. Imaginons que c'est une page contenant des informations que l'auteur a jugé plus tard comme étant sensible. Il l'a supprimé et puis on peut la retrouver ?
Bizarre.
@sensass
Oui je me posais la même question. Si certaines pages n'existent plus c'est qu'il y a une raison et dans certains cas leurs auteurs ne doivent pas apprécier de les voir réapparaître...
Archiver pourquoi pas mais avec le consentement de leurs auteurs me paraît une meilleure méthode si tant est que cela soit faisable pour un archivage aussi titanesque.
@ sensass
Plus que bizarre... c'est une atteinte aux droits fondamentaux à mon sens : tu mets à disposition ce que l'auteur à voulu supprimer, ou ne veut plus mettre à disposition...
C'est pour ça que on peut créer un fichier robot.txt qui fait que Internet Archive n'archivera pas les pages qu'on à indiqué dans le robot.txt
Sans parler de vie privée, il faut que le webmaster fasse correctement son boulot avec les outils HTML à disposition, c'est à dire entête de redirection (si l'URL a changé, ou définitivement supprimée, etc...), du SEO quoi.
Après c'est vrai que j'avais zappé ce Internet Archive, faut que j'y jette un oeil, Dark-mac si tu as des pistes, je suis preneur
Parlez de vie privée sur l'internet... Vous êtes top drôle.