Une extension Wayback Machine pour Chrome cherche les pages disparues

Florian Innocente |

Internet Archive a sorti il y a quelques jours une extension pour Chrome, capable d'aller puiser dans son stock de pages archivées lorsque vous tombez sur un message d'erreur au gré de vos déambulations sur le web. Les amateurs de Firefox ont également une telle solution.

Le cas le plus courant est l'erreur 404, lorsque la page correspondant à une URL a disparu, mais il en existe beaucoup d'autres qui ont la même conséquence pour l'internaute : une voie sans issue et un contenu disparu.

Tapez par exemple une vieille adresse chez Apple comme www.apple.com/powerbook
Un nouveau Mac livré « en standard » avec un lecteur/graveur de CD/DVD. C'est vraiment une ancienne page !

Lorsque l'extension détectera l'affichage de l'un de ces codes d'erreur, elle ira automatiquement interroger la base de données d'Internet Archive pour voir s'il n'existerait pas une version enregistrée de la page qui figurait à cet endroit.

Avec 20 ans d'activité et, à ce jour, plus de 279 milliards de pages web enregistrées puis archivées il y a peut-être une chance que la page disparu subsiste dans le fond constitué inlassablement par Internet Archive. Cette dernière insiste également sur les questions de confidentialité. L'extension n'exploitera pas votre historique de navigation et l'Internet Archive discute avec Google pour insérer des serveurs proxy de manière à opacifier l'origine des requêtes et les adresses IP.

avatar sensass | 

Et la vie privé. Imaginons que c'est une page contenant des informations que l'auteur a jugé plus tard comme étant sensible. Il l'a supprimé et puis on peut la retrouver ?
Bizarre.

avatar concretebubbles | 

@sensass

Oui je me posais la même question. Si certaines pages n'existent plus c'est qu'il y a une raison et dans certains cas leurs auteurs ne doivent pas apprécier de les voir réapparaître...
Archiver pourquoi pas mais avec le consentement de leurs auteurs me paraît une meilleure méthode si tant est que cela soit faisable pour un archivage aussi titanesque.

avatar iAnn | 

@ sensass

Plus que bizarre... c'est une atteinte aux droits fondamentaux à mon sens : tu mets à disposition ce que l'auteur à voulu supprimer, ou ne veut plus mettre à disposition...

avatar Wes974 | 

C'est pour ça que on peut créer un fichier robot.txt qui fait que Internet Archive n'archivera pas les pages qu'on à indiqué dans le robot.txt

avatar xDave | 

Sans parler de vie privée, il faut que le webmaster fasse correctement son boulot avec les outils HTML à disposition, c'est à dire entête de redirection (si l'URL a changé, ou définitivement supprimée, etc...), du SEO quoi.
Après c'est vrai que j'avais zappé ce Internet Archive, faut que j'y jette un oeil, Dark-mac si tu as des pistes, je suis preneur

avatar Orus | 

Parlez de vie privée sur l'internet... Vous êtes top drôle.

CONNEXION UTILISATEUR