Il y a eu un orage en Belgique le 13 août. Et la foudre est tombée. Sous la foudre, en Belgique, le 13 Août, un Data Center de Google. Dans ce Data Center, nos données. Une petite partie de nos données, réparties entre la quarantaine de Data Centers de la firme. Stockées non pas dans des nuages mais sur des disques durs empilés dans des racks de serveurs disposés dans des salles blanches.
<J'ai encore dit #nawak mais j'ai la chance d'avoir des relecteurs attentifs et pédagogues>
Or donc je me suis – oui, encore – planté. Mais je suis pas le seul, Ecrans.fr s'est planté aussi 😉 Car non en fait des données n'ont pas été "effacées". Je reproduis donc ici le gentil mail de Jef Mathiot (aka @Touittouit) qui explique tout très très très bien. Seule bonne nouvelle, la fin de ce billet (à partir de "J'ai perdu mes clés") reste lisible indépendamment de mon erreur d'interprétation initiale. Pour le reste :
"Google Compute Engine, c'est Google qui utilise ses compétences historiques en infrastructure pour faire un paquet de pognon en devenant hébergeur (et pousser l'intégration de certains de ses produits chez les clients de GCE, accessoirement). Amazon l'a fait, avec Amazon Web Services, ou Microsoft, avec Azure. Ces services ne stockent pas stricto senso les données, ils fournissent l'infrastructure d'hébergement à des clients qui, eux, le font.
D’après le rapport d’incident de Google (plutôt bon, franchement), une power grid alimentant, dans ce data centre, les services de stockage de Google Compute Engine (donc pas le data centre dans son ensemble, et surtout des clients censés être préparés à ce type de problèmes) a été frappée par un succession de décharges. Les systèmes auxiliaires d’alimentation électrique ont pris le relais, mais certains n’ont pas tenu la charge. Cela a poussé un certain nombre d’équipements à s’arrêter – apparemment “gracieusement” et donc sans interruption brutale ni destruction – mais réduisant d'autant la capacité de l’infra de stockage à répondre à de nouvelles sollicitations.
A la lecture du rapport toujours, aucune information stockée au préalable n’a ainsi été détruite, mais l’infrastructure s’est mise à produire des erreurs d’écriture et de lecture lors de nouvelles requêtes. On comprend ainsi que les 0.000001% ne concernent pas “une destruction de données”, mais une indisponibilité temporaire de la capacité totale du service “Persistent Disks” de GCE dans ce data center à répondre aux opérations de lecture et, surtout, d’écriture. Quand, dans le communiqué, ils parlent de “permanent data loss”, ils évoquent donc des données qui n’étaient pas encore écrites physiquement par les applications hostées par les clients. Dans la partie “REMEDIATION AND PREVENTION”, ils laissent entendre que le souci s’est posé principalement sur un étage intermédiaire situé en amont de la persistence effective (cache) de certaines nouvelles données (“upgrade our hardware to improve cache data retention during transient power loss”).
Ils précisent en outre qu’environ 5% des “disques” (qu’il ne faut pas entendre comme de simples disques durs physiques, mais comme des espaces logiques de stockage alloués dans une immense grille de disques, dont les données sont par ailleurs répliquées localement dans le DC, les fameux "persistent disks") ont subi au moins un échec d’une opération de lecture ou d’écriture. Une opération d’écriture ou de lecture, ça ne signifie nullement une photo de chat ou un fichier client dans son ensemble.
Quand tu traduis (ou utilises une traduction) “Lundi 17 Août, seule une toute petite partie des disques reste encore endommagée, au total moins de 0,000001% de l’espace alloué sur les disques persistants”, il faudrait plutôt comprendre “Lundi 17 Août, seule une toute petite partie des disques reste encore concernée, au total moins de 0,000001% de l’espace disponible sur le service “Persistent Disks” du data center d’europe de l’ouest.”. Du coup, “Moins de 0,000001% de nos données”, ou “Qu’un éclair ait détruit 0,000001% d’1/50ème des 0,005% de l’information disponible”, n’ont pas vraiment de sens. Qu’un éclair ait empêché, pendant quelques heures, 0,000001% du système de stockage distribué de répondre de manière stable à l’ensemble des sollicitations des clients de Google Compute Engine."
Merci Jef Mathiot.
</J'ai encore dit #nawak>
Sous la foudre, en Belgique, le 13 Août, une petite partie des disques durs de ce petit Data Center a été endommagée. Dans un communiqué datant du 18 Août, Google indique :
"Lundi 17 Août, seule une toute petite partie des disques reste encore endommagée, au total moins de 0,000001% de l'espace alloué sur les disques persistants du data center d'europe de l'ouest. Dans ces cas, la récupération totale (des données) est impossible."
Moins de 0,000001% de nos données. Il fut un temps où des chercheurs avaient estimé que le moteur de recherche de Google ne donnait accès (et donc ne conservait sur ses serveurs) qu'à 0,005% de l'information disponible.
Dans l'étude de 2003 (How Much Information In The World), étaient pris en compte les emails, la messagerie instantanée mais on était encore loin du "Cloud Computing", nos habitudes – contraintes – de stockage en ligne n'étaient pas encore installées et n'avaient pas l'ampleur et le systématisme qu'elles atteignent aujourd'hui. Bref, nos disques durs n'avaient pas encore disparus. Ainsi, si en 2015 on ajoute à l'information "publique" l'ensemble de nos données et documents privés ou privatifs (musique en ligne, streaming vidéo, services de stockage dédiés, etc.), difficile de dire à quel pourcentage de cet ensemble d'information Google donne accès et quel volume est stocké dans ses différents Data Centers.
Mais admettons que le pourcentage de 2003 reste vaguement opératoire. Le 13 Août en Belgique, un orage a donc rendu impossible la récupération de données occupant 0,000001% du Data Center contenant 1/40ème ou 1/50ème de 0,005% de l'information accessible grâce à Google.
Et une nouvelle fois impossible de "visualiser" ce que peut représenter cette perte à l'échelle d'un individu, d'un groupe ou d'une communauté. Qui sont les individus concernés par cette perte ? Et comment se manifeste-t-elle ? Quelle importance revêt-elle ? S'agit-il, pour Monsieur X de quelques mails irrémédiablement effacés ? Pour Madame Y de quelques albums de photos de vacances en Crête irrémédiablement perdus ? Qui s'en soucie ?
On apprendra finalement que les disques durs concernés étaient réservés à des clients professionnels qui paient pour disposer d'espace de stockage dédié.
LE numérique, LE cloud, LES données. Nothing Personal.
Nous pensons presque systématiquement "le" numérique comme une totalité. Vertige et mythologie des grands nombres, expressions sémantiquement trompeuses – quoi de plus physique que l'industrie lourde du Cloud ? -, discours marketing de l'omni-synchronicité et de l'ubiquité d'accès des biens et des services. Mais "le" numérique n'a d'existence que dans l'expérience personnelle qu'il revêt pour chacun de nous, dans chacun de ces instants confiés "au réseau" et aux infrastructures privées qui en sont le plus souvent les dépositaires finales.
Qu'un éclair ait détruit 0,000001% d'1/50ème des 0,005% de l'information disponible dans ce qui n'est finalement que l'un des outils d'accès et de stockage est accessoire, anecdotique, inessentiel. Sauf naturellement pour ce mail perdu qui disait un amour de jeunesse. Sauf bien sûr pour cette photo d'une plage de Crête avec cet enfant parti depuis. Sauf peut-être pour ce fichier-client moins nostalgico-glamour que les exemples précédents mais pourtant tout aussi "important".
Chaque jour des données sont accidentellement perdues, irrémédiablement effacées. Chaque jour des données "fuitent". Fuite, effacement accidentel ou perte irrémédiable, chacune de ces données dit quelque chose de chacun d'entre nous. Elles sont à la fois l'instanciation la plus triviale mais aussi la part la plus intime, la plus "incarnée" de notre présence au numérique.
En Novembre 2013, l'un des bâtiments de l'Internet Archive a brûlé. Il aurait pu s'agir cette fois d'une perte de données et de documents considérés comme "patrimoniaux" à l'échelle de l'humanité. Ce n'est pas la première fois qu'une bibliothèque brûle. Fut-elle un Data Center. Ce ne sera probablement pas la dernière. En attendant le grand accident de la grande faille de silicone ou la fermeture de Youtube.
J'ai perdu mes clés.
Il nous arrive régulièrement de perdre autre chose que nos données. Nous perdons nos clés de voiture, nous perdons cette adresse notée sur un post-it, nous perdons le bulletin trimestriel du petit dernier, nous perdons nos papiers d'identité. Il nous arrive parfois de les retrouver. Comme il nous arrive et nous arrivera encore de perdre des données. Comme il nous arrivera parfois de les retrouver.
La perte d'une clé de voiture engendre l'impossibilité temporaire d'utiliser ce moyen de locomotion. La perte d'un papier d'identité peut rendre compliqué ou impossible ce déplacement prévu à l'étranger. La perte d'un "dossier scolaire" rendra ubuesque le transfert – c'est à dire in fine le déplacement – de cet élève dans son nouveau lycée. La perte de l'adresse notée sur ce post-il rendra impossible le déplacement vers ce rendez-vous prévu. La perte de cette télécommande rendra impossible le changement de chaîne, c'est à dire le déplacement d'une chaîne vers une autre. Quand nous perdons des objets, nous perdons le plus souvent une capacité individuelle à nous mettre en mouvement. Et nous perdons subséquemment un temps parfois infini à retrouver cette capacité de mouvement.
J'ai perdu la mémoire.
Il arrive régulièrement que des bibliothèques brûlent. Que des sites archéologiques soient détruits ou pillés par des intégristes ou par des guerres. Nous perdons alors une partie de notre "patrimoine". Ce qui est rendu impossible par cette perte n'est plus de l'ordre du déplacement mais de l'histoire avec un grand "H", c'est à dire d'une certaine forme d'historicité, de temporalité. Nous perdons la mémoire. Nous perdons non pas "du" temps mais "le" temps, "ce" temps-là, la trace de ce temps-là. Quand nous perdons des documents ou des lieux patrimoniaux nous perdons essentiellement la capacité collective à comprendre l'Histoire c'est à dire la marche du temps.
J'ai perdu mes données.
Demain nos voitures ne démarreront plus avec des clés mais avec des données. Trivialement, perdre ses données pourra donc également empêcher notre mise en mouvement individuelle.
Aujourd'hui déjà nos bibliothèques sont – aussi – faites de données et de méta-données. Trivialement, perdre ces données pourra donc également nous empêcher collectivement de comprendre l'histoire.
Alors pour les données qui permettent de démarrer les voitures comme pour les données qui permettent de lire ce manuscrit vieux de plusieurs siècles nous mettons en place des processus de sauvegarde, d'archivage, de réplication. Dont le systématisme, la fiabilité, la robustesse et la résistance sont directement corrélés à l'importance, à la valeur, stratégique ou patrimoniale, de ces données. Du moins se plait-on à le supposer.
Mais que perdons-nous vraiment quand nous perdons des données ? "Nos" données ?
Nous perdons un peu de citoyenneté. Oui. Carrément.
La citoyenneté est une appartenance qui se fonde sur un double processus de reconnaissance. Je me reconnais (administrativement, financièrement par l'impôt, symboliquement, spirituellement, etc.) dans l'appartenance à une communauté et cette communauté me reconnaît en retour en m'octroyant un certain nombre de droits dans la mesure où je continue de m'acquitter d'un certain nombre de devoirs.
Chacune de nos "données", de la plus brute à la plus construite, signe aujourd'hui cette appartenance, cette citoyenneté nouvelle. Une adresse mail déposée au bas d'une pétition en faveur de la réduction des gaz à effet de serre ne signe pas la même appartenance que la même adresse mail laissée à l'inscription sur un site de rencontre.
Or le numérique, ou plus exactement la perception du numérique que nous renvoient la plupart des médias et des analystes depuis plus de 15 ans est une vision presque caricaturalement data-centriste. Une vision qui oublie, qui rend invisible le fait que "le-numérique-désormais-dissout-dans-ses-données (qui sont avant tout les nôtres) atomise, fragmente et vaporise littéralement nos appartenances et les signes de reconnaissance qui leurs sont habituellement associés. Ce faisant il dilue jusqu'à la rendre impossible et impraticable cette citoyenneté nouvelle dont le web fut pourtant, et pour un temps, initialement porteur (et pas uniquement dans la déclaration d'indépendance du cyber-espace).
Citizen Dark.
Alors on nous fait le coup du Dark Web comme on nous faisait jusqu'ici le coup des banlieues et des zones de non-droit. Cela ne vous a pas frappé ? Hier les banlieues dans lesquelles la république n'avait plus le droit de cité, lieux de tous les trafics, de toutes les délinquances, et aujourd'hui le Dark Web, nouveau lieu de tous les trafics et de toutes les délinquances, de toutes les transgressions. Des données sont chaque jour perdues ou volées. Et où les retrouve-t-on ? Sur le Dark Web où elles s'échangent au prix du Bitcoin. Autres données, autres banlieues, autres monnaies.
Mais dans les banlieues des périphéries de nos villes comme dans les banlieues du Dark Web se créent aussi – et peut-être avant tout – de nouvelles formes d'appartenance et de citoyenneté. Les politiques publiques ont, de manière réfléchie et patiente, construit ces banlieues dans lesquelles il est désormais impossible de voir autre chose qu'un stigmate de leur propre échec et de leur propre abandon citoyen. L'absence d'un vrai projet politique de l'internet a, de la même manière, selon les mêmes processus, et hélas souvent avec les mêmes résultats, conduit à l'émergence du Dark Web. On y retrouve les données volées d'une citoyenneté fantoche en recherche d'une représentativité que le "web public" – ses plateformes et ses politiques – lui refuse ou lui dénie.
Un éclair dans le cloud.
C'est en tout cas ce qui m'a frappé en lisant le récit de ce soir d'orage du 13 Août, quelque part en Belgique. Comme si à force de vouloir enfermer le web, ses usages et ses représentations, dans le manichéisme de métaphores pataudes toujours plus data-centrées, entre "autoroutes de l'information" puis "océan insondable" (souvenez-vous du Deep Web et du Web de surface) et désormais "informatique en nuage", comme si nous étions depuis le commencement presqu'incapables de filer la seule métaphore qui vaille, celle d'une citoyenneté nouvelle, et qu'un soir d'orage, soudain, un éclair qui n'était pourtant pas de lucidité, prenait un malin plaisir à venir nous le rappeler.