Firefox et l’Internet Archive luttent contre les « liens rompus »

Anthony Nelzin-Santos |

Vous cliquez sur un lien… et vous tombez sur une page d’erreur 404 plutôt que sur la page que vous vouliez lire. Ce « lien rompu » est un exemple de « détissage » de la Toile, un phénomène provoqué par le déplacement ou la suppression des pages web, qui toucherait plus de la moitié des liens. Mais ce n’est pas une fatalité : Mozilla entend le combattre avec le concours de l’Internet Archive.

Un lien rompu…
Un lien rompu…

L’association se consacre à l’archivage du web depuis 1996 : sa Wayback Machine enregistre plus de 20 To de pages web chaque semaine, pour un total approchant les 10 Po d’archives et 500 milliards de pages. Des chiffres impressionnants, mais l’Internet Archive est loin d’être exhaustive, et des millions de pages web ont sans doute été perdues à jamais.

Reste que cette archive est à ce point étendue qu’elle contient une ou plusieurs versions de nombreuses pages dont les liens pointent aujourd’hui vers des erreurs 404. C’est là que Mozilla entre en jeu : avec l’extension No More 404s du module Test Pilot, Firefox est capable de répondre à une erreur 404 avec un lien vers une archive de la Wayback Machine.

…ressuscité par No More 404s et la Wayback Machine.
…ressuscité par No More 404s et la Wayback Machine.

Cette extension ne résout pas le problème plus sournois des redirections, mais elle a l’avantage de la simplicité et de la rapidité. Pour des besoins plus complexes, le site gHacks pointe vers le module Resurrect Pages, qui exploite non seulement l’Internet Archive, mais aussi WebCite et archive.is.

avatar TmrFromNO | 

Ca marche pour les sites pornos?

avatar noooty | 

20To chaque semaine, et un total de 10Po... Gloups... Mon serveur serait rempli chaque semaine...

avatar pat3 | 

Mais à part ça, Firefox c'est mort, plus personne n'utilise…

avatar Average Joe | 

Parle pour toi, je m'en sers tout le temps depuis des années. J'aime sa fonctionnalité de pouvoir changer l'apparence même si je ne l'ai plus fait depuis un moment.

avatar Alex Giannelli | 

Fonctionnalité très intelligente ! Fallait y penser.

avatar Le docteur | 

Impressionnant.

avatar CaptainBinouz | 

Toutes ces pages récupérées contiennent du texte mais aussi des fonds graphiques, images, parfois des photos, même des fichiers audio et vidéo. 20 To par semaine, finalement cela semble assez léger.

avatar sambucus | 

Et avec Safari, existe-t'il une extension ou une méthode ?

avatar marc_os | 

Ah bon, les redirections c'est sournois ?
Et dans 10 ans quand vous referez votre site entièrement et devrez changer sa structure ainsi que son arborescence et l'organisation des URLs, vous ferez comment pour les anciennes URLs afin d'éviter les erreurs 404 ?

CONNEXION UTILISATEUR