Gimme my Data Back. Achille et la Data.

Google vient d'annoncer la mise en place d'une fonctionnalité permettant de récupérer l'ensemble de ses données dispersées dans son écosystème de services. Pour l'instant seules les données de Google Calendar sont récupérables mais dès le mois prochain c'est – notamment – une archive de Gmail qui devrait être rendue disponible.

Il y a quelques temps de cela (novembre 2010), c'était au tour de Facebook de nous permettre de récupérer une archive de nos données. Je m'étais alors livré à un petit exercice d'analyse intitulé "650 téra-octets de données personnelles, et moi et moi et moi …"

Vu l'étendue et l'usage des services Google listés sur la copie d'écran ci-dessus, on imagine aisément la volumétrie des données qui nous seront ainsi rendues. Et c'est précisément cette volumétrie qui pose question et permet de répondre à la question – justement – que tout le monde se pose :

Mais pourquoi Google a-t-il attendu si longtemps – 3 ans de plus que Facebook – avant de nous permettre de récupérer nos données ???

Rapide retour en arrière.

Phase 1 : Gmail est lancé le 1er Avril 2004 et se positionne comme un service aux capacités de stockage non seulement inédites pour l'époque (1 giga) mais en plus en augmentation permanente (le petit compteur incrémental disposé sur la page d'accueil du service à l'époque)

Phase 2 : à chaque fois que l'on veut vider notre corbeille Gmail (c'est toujours le cas sur certains comptes), un petit message nous fait insidieusement remarquer : "nul besoin de supprimer des conversations lorsque l'on dispose d'une space de stockage aussi important !"

Phase 3 : le Cloud s'intalle comme le modus operandi privilégié de la quasi-totalité des services des majors du web, d'Amazon à Google en passant par Apple.

Phase 4 : Google nous propose en 2013 de pouvoir bientôt (dans un mois en Europe, le service serait déjà actif aux US), récupérer nos données.

Récupérer mes données OK. Mais pour les mettre où ?

Rappel. Les Chromebooks d'entrée de gamme ont un disque dur d'une capacité de stockage de 16 Gigas. Mon seul compte Gmail occupe déjà plus de 7 gigas. Si j'y ajoute mes photos et mes vidéos, le "disque dur" de mon ordinateur est très largement saturé. Et je ne suis pas un gros utilisateur de photos et de vidéos … On m'objectera que tout le monde n'a pas un Chromebook, que nombre d'ordinateurs ont encore des capacités de stockage dépassant le térabit, que les disques durs externes existent toujours … Certes. Mais les usages sont clairs et pointent un paradoxe contemporain : plus les capacités de stockage résidentes augmentent, plus elles sont rapidement "remplies" par des processus "de fonctionnement" (systèmes d'exploitation + les applications de base et leurs innombrables et disproportionnées "mises à jour") et moins elles sont utilisées au profit d'usages "full cloud", usages eux-mêmes de plus en plus incitatifs et contraints. Dans la guerre au coût cognitif nul des interfaces homme-machine (IHM), l'avantage tourne clairement au profit du Cloud. La récupération de données en mode local et résident nécessite non pas une connaissance experte de routines de sauvegarde mais à tout le moins un effort cognitif dans lequel nombre d'usagers ne sont pas prêts à s'engager.

Récupérer mes données OK. Mais pour en faire quoi ?

Il y a 3 ans j'ai récupéré mes données Facebook. L'ensemble de mes status, ma liste d'amis, le nombre de mes likes, etc. Je récupèrerai demain l'ensemble de mes données Google, car c'est – même si ce billet pourrait avoir l'air de pointer l'inverse – car c'est essentiel d'avoir cette possiblité de le faire. Je le ferai par curiosité. Pour contempler … pour contempler quoi ?? Que me diront mes données Google ? Que me dira l'archive de la totalité de mes mails sauvegardée localement ?

Hardware > Software > Dataware > Cloudware > … Userware ?

Dans l'histoire de l'informatique, le matériel (Hardware) a permis l'éclosion de logiciels (Software) générateurs de données (Dataware) qui ont ensuite migré dans le nuage (Cloudware), et qui se retrouvent aujourd'hui possiblement remises à disposition des usagers. Sauf que nous avons de moins en moins la place de stocker localement ces données. Sauf que nous n'avons plus les outils pour "traiter" ces données. Pour leur donner du sens. Pour les interpréter.

Sauvegarde locale ne vaut pas réappropriation.

Disposer d'une copie résidente de nos données n'a aujourd'hui hélas presque plus aucun sens. C'est précisément pour cela que Google nous permet de le faire. Les anciens albums de photos de famille en argentique racontaient une histoire par la fixité du moment capté et par la rareté des éléments et événements conservés. Nos usages du numérique, en multipliant la volumétrie de ces éléments, de ces événements, en multipliant également les moments où ces captations sont rendues possibles et en les facilitant, en les "appareillant" jusqu'à rendre nul le coût cognitif nécessaire à leur inscription, nos usages du numérique disais-je, ont déplacé la charge émotionnelle et mémorielle du côté de la relation, du réseau et du contexte là où elle était hier associée à l'événement lui-même. Nos données sont des vues décentrées de nous-mêmes que moteurs et réseaux sociaux cherchent à toute force à recentrer, à recontextualiser en permanence. L'exact inverse d'un narcissisme supposé.

Achille et la tortue Data.

Il nous faudra demain de nouveaux albums de famille. Hier ils comptaient péniblement quelques dizaines de photos pour une vie entière quand aujourd'hui chaque mois de notre vie est documenté par des centaines de "captures". Hier ces quelques dizaines constituaient le plus petit commun multiple d'une génération à une autre, autour duquel il nous appartenait de raconter une histoire, de faire entrer en résonnance les rares éléments de cette maigre collecte. Aujourd'hui il nous appartient de choisir ce qui pourra en effet faire sens pour nous-mêmes et pour d'autres après nous dans un environnement où chaque item, où chaque signe, où chaque trace est d'abord la preuve de son propre potentiel multiplicatoire, à la fois l'aveu et le serment de notre allégeance aux services hors lesquels il nous est désormais impossible ou cognitivement très coûteux d'identifier le plus grand commun diviseur de cette exponentielle fatrasie de traces.

Disposer de 40 photos pour raconter une vie reste du domaine du possible précisément car ces 40 photos ne prétendent pas résumer exactement la vie en question. Des centaines de téraoctets de photos pour la même vie rendent paradoxalement sa narration et donc sa transmission impossible, puisqu'il devient proportionnellement plus long de consulter l'archive elle-même que d'en extraire du sens. Achille et la tortue. Nous sommes tous des Achille. Nos tortues sont nos données. Logiquement, nous ne rattraperons jamais nos données. C'est un problème (c'est même un problème NP-Complet).

Pour une ingénierie sociale de l'appropriation.

La solution, car il y en a une, réside dans le développement d'applications qui permettront à chacun de nous, à l'échelle de son réseau de pairs, à l'échelle de sa volumétrie de données, de calculer son empreinte numérique comme on calcule son empreinte carbone, de nous rendre non plus simplement nos données mais également les moyens de les lire, les outils permettant d'y naviguer, de les resituer dans leur contexte, les outils nous permettant, de nouveau, de raconter à d'autres l'histoire des vies passées sans nécessairement à avoir pour le faire à revisionner l'entièreté de ces vies.

<Alerte métaphore moisie> Parce que pour se déplacer d'un point à un autre, on ne demande pas à un constructeur automobile de nous rendre les données (= les pièces) permettant d'usiner un véhicule de transport. On lui demande de nous rendre possible l'expérience du déplacement. </alerte métaphore moisie>

La solution sera de nous rendre bien plus que nos données : les algorithmes qui les gouvernent. Nous rendre nos données est une chose (et une chose essentielle). Nous rendre le contrôle en est une autre.

Je demeure convaincu que les leaders du web de demain seront précisément ceux qui nous rendront ce contrôle. Il faudra d'abord nous permettre de les visualiser, c'est à dire de les faire entrer dans l'espace d'une page quelle qu'en soit la volumétrie et l'étendue. A la manière de ce qu'est capable de nous rendre un Wolfram Alpha dans son approche "personnal analytics" des données Facebook. A la manière d'applications … dont j'ai promis de ne pas vous parler avant le 12 décembre 😉

"Il n’y a rien que l’homme soit capable de vraiment dominer : tout est tout de suite trop grand ou trop petit pour lui, trop mélangé ou composé de couches successives qui dissimulent au regard ce qu’il voudrait observer. Si ! Pourtant, une chose et une seule se domine du regard : c’est une feuille de papier étalée sur une table ou punaisée sur un mur. L’histoire des sciences et des techniques est pour une large part celle des ruses permettant d’amener le monde sur cette surface de papier. Alors, oui, l’esprit le domine et le voit. Rien ne peut se cacher, s’obscurcir, se dissimuler." Bruno Latour, Culture technique, 14, 1985 (cit par Christian Jacob dans L’Empire des cartes, Albin Michel, 1992).

De cette visualisation possible, émergera alors la possibilité d'une saisie globale, elle-même préalable à une réappropriation partielle, elle-même postulat non-négociable d'une reprise de contrôle observable. Avant cela il faudra que cesse cette fascination entretenue pour le déluge de données à notre portée distante ou maintenant résidente, pour que nous puissions nous concentrer sur la fabrication de l'arche du Data déluge. Avant cela il nous faudra cesser de croire que l'algorithme est le chêne et les données le roseau de la fable, alors que c'est précisément l'inverse.

Alors nous pourrons recommencer à naviguer. A raconter. A reformuler des questions. Contre la satiété des réponses … données.

3 commentaires pour “Gimme my Data Back. Achille et la Data.”

Hubert Guillaud dit :

5 décembre 2013 à 23h13

Décidément, nous sommes en phase (cf. conclusion) : http://www.internetactu.net/2013/12/05/en-quoi-les-big-data-sont-elles-personnelles/

Répondre
DWT dit :

6 décembre 2013 à 9h22

comme tjrs à latoute vitesse ! merci pour ce blog/info supportant une thèse (et association) que je soutiens depuis <2000 - dite Unité Cybernétique de Mémoire de Personne Physique ( http://www.psybakh.net/2013/htm/ )

Répondre
Michel dit :

11 décembre 2013 à 10h45

Bonjour.
Pourquoi pouvoir récupérer nos données ?
Pardonnez mon commentaire un peu terre-à-terre, mais simplement pour éviter qu’elles ne disparaissent avec l’entreprise qui prétend en avoir l’usage exclusif via ces contrats léonins que sont les CGU d’aujourd’hui.
Pour pouvoir se les (ré)approprier (ou pas), encore faut-il en disposer. La technologie tente, en coordination évidente avec le domaine du logiciel, de nous contraindre à nous déposséder de nos données pour en faire une marchandise comme une autre.
C’est aux utilisateurs de résister…. (points de suspension)

Répondre