Perte de données : la mauvaise blague belge de Google

Mickaël Bazoge |

Un orage dans le nuage, a priori, rien de plus naturel… Sauf qu’en frappant à quatre reprises sur le data center de Google à Saint-Ghislain (Belgique), la foudre a provoqué le 13 août dernier une coupure de courant qui a occasionné une perte de données. Le moteur de recherche explique que les systèmes auxiliaires ont pris la main et ramené le courant au sein de l’installation. Malgré les sauvegardes, « des données récemment ajoutées au système ont été effacées de manière définitive », déplore Google.

De fait, 0,000001% des données stockées dans ce data center ont été endommagées par l’incident, qui ne pourront plus être restaurées par les utilisateurs. Il s’agit pour la plupart de photos enregistrées dans Google Drive, dont la « récupération complète est impossible », se désole l’entreprise. Cette dernière assume la responsabilité de l’incident, rarissime heureusement, et promet de renforcer encore son infrastructure pour faire en sorte que cela ne puisse plus se reproduire à l’avenir.

Georges Ataya, professeur en IT Governance à la Solvay Business School, explique pour Le Soir qu’il ne faut cependant pas s’attendre à ce que Google duplique l’ensemble des données stockées dans ses serveurs : « Dupliquer toutes les données est irréaliste. Cela ne se justifie pas économiquement ». Il ajoute que « si l’on se contente d’utiliser des services gratuits, il ne faut pas s’attendre à obtenir un service garanti ».

Pour éviter ce genre de problèmes, mieux vaut effectuer aussi une sauvegarde en local et mettre en place une véritable stratégie de sauvegarde de ses documents. Notre guide Sauvegardez ! vous livre toutes les clés pour être tranquille au quotidien.

Mise à jour — Les 0.000001% des données perdues ne constitueraient en fait « aucune perte réelle », a tenu à rassurer Google au Soir. Aucun contenu provenant d’utilisateurs n’aurait été touché finalement.


avatar Androshit | 

C'est gratuit, c'est pas garanti, c'est toi le produit... bon esprit...

avatar Mathias10 | 

@Androshit :
Hihi

avatar frankm | 

T'inquiète Google te rassure ils vont seulement perdre 0.000001% de bénéfices !

avatar rikki finefleur | 

Car tu crois que le payant tout est paré contre tous les incidents ?
T'es juste marrant .. et goog a certainement des installations bien plus sérieuses que nombre d'hébergeurs..

avatar backfromcharly33 (non vérifié) | 

Je pense que l'humanité s'en remettra;-)

avatar dperetti | 

Google Drive ? Non ça a plutôt l'air de concerner Google Compute Engine.

avatar Ast2001 | 

Je ne comprends pas non plus d'où sort l'information que ce sont des photos stockées sur Google Drive.

avatar lmouillart | 

Au final il n'y a pas de pertes de données utilisateurs : http://goo.gl/4e5YSD

avatar françois bayrou | 

Si un orage fait ces dégats, je vous laisse imaginer le jour où on va se taper la prochaine vraie éruption solaire. Ca va lui faire tout drôle, au bigdata…

https://fr.wikipedia.org/wiki/%C3%89ruption_solaire_de_1859[/embed]

https://fr.wikipedia.org/wiki/%C3%89ruption_solaire_de_1989[/embed]

avatar macbookintel | 

D'habitude on leur reproche de ne pas savoir effacer les données :)

avatar Novezan | 

@macbookintel :
ÉnOOOOOOrme !!!!

avatar XiliX | 

@macbookintel

Oui mais là les "dieux" en ont décidé autrement. Ils ont envoyé la foudre pour effacer les traces de leurs connexions et les photos de leurs coquinneries chez AshleyMadison divulguées récemment

avatar bonnepoire | 

On le voit sur la photo, c'est une fille qui gère le truc. Normal que ça plante...

avatar Hercule Poirot | 

Wut ?

avatar zoubi2 | 

LOL !!

avatar enzo0511 | 

Moi qui croyait que les data centers travaillaient en redondance pour éviter ce genre de chose
Finalement le cloud est loin d'être fiable

avatar treizep | 

Très drole. Il vaut mieux se renseigner que de "croire". Mais en général on ne commence à creuser plus loin que le jour où l'on a perdu des données.

avatar bonnepoire | 

C'est la cas chez Apple.

avatar enzo0511 | 

Comment se fait par ailleurs qu'un tel bâtiment ne soit pas protégé contre la foudre ?
Un bâtiment technique meme un entrepôt est généralement pourvu de paratonnerre

avatar madaniso | 

Il existe toujours une sauvegarde sur votre machine physique si vous synchronisez votre appareil.

avatar cloudy | 

@enzo0511 : Oui il ya de la redondance cross datacenter.

Mais très peu d'entreprise travaille avec une réplication synchrone car celle-ci n'est pas assez performante et cela se ressent au niveau de l'utilisateur final (en gros il faut que la donnée ait atteint deux datacenters aux moins). La plupart utilise des réplications asynchrones entre leurs datacenters :

- la donnée est bien prise en compte par le premier DC

- on indique à l'utilisateur que tout est OK

- dans un délai cours on réplique sur le second DC

Les réseaux actuels sont un frein à l'exploitation de la réplication synchrone et à la durabilité maximale de la données que celle-ci apporte. C'est entièrement lié au fameux théorème de CAP que connaissent tous les ingés qui bossent sur des systèmes distribués.

Certaines bases de données NoSQL délèguent même le choix au développeur qui peut indiquer pour chaque insertion ce qu'il souhaite (une donnée durable ou non). Par exemple c'est le cas de Cassandra (write quorum). Le développeur qui souhaite une donnée parfaitement durable indiquera un quorum qui le permet spécifiquement au détriment du temps de réponse. Sa requête pourrait par ailleurs finir en échec si le lien entre les DCs est perdu. D'autres systèmes ne proposent qu'un seul mode de réplication asynchrone entre DCs (Couchbase par exemple).

Pour résumer, face à de tels volumes de données, tous les ingénieurs doivent faire des choix entre performances, accessibilité et durabilité de la donnée. C'est insurmontable en vertu du théorème de CAP. La réplication asynchrone reste néanmoins nettement plus sécurisé du point de vue de la donnée qu'un stockage local géré par mr toutlemonde. En général on estime qu'on peut perdre entre 1s et 10s de données (la latence de réplication).

avatar rikki finefleur | 

trop long pour androshit.. :(

avatar cloudy | 

Aucun préstataire n'offre une durabilité de 100% sur la données par ailleurs.
Par ex Amazon S3 garantit "99.999999999% durability of objects over a given year.".

C'est bien mieux que la plupart des datacenters géré en propre mais ce n'est pas 100%.

avatar CBi | 

C'est peut-être comme dans les banques : quand il y a un casse de la salle des coffres, ceux qui se sont fait dérober une collection de photos hard déclarent en général n'avoir rien perdu...

avatar 6nemax | 

quelle insolence de fustiger google alors que, dans le cas qui nous occupe, ce sont les éléments naturels, en l'occurrence 4 fois la foudre, qui s'est abattue sur un Data Center. Même le titre de cette news est ironique. C'est oublier bien naïvement qu'on est bien peu de chose quand la nature parle.
De plus quand le service est gratuit, on peut difficilement exiger un backup sécurisé.

Pages

CONNEXION UTILISATEUR