Les données ? C’est de la merde. Justement.

Ok. J'explique rapidement le titre un tantinet vulgaire. A l'occasion de la conférence CHI 2014 (sur les interfaces / interactions homme-machine) un groupe d'étudiants a publié un site sur un prototype un peu particulier dédié au "quantified self" : des toilettes. Des "Quantified Toilets" très exactement. Et oui.

#BigData versus #GrosCaca

Alors bien sûr c'est une blague potache. Mais pas vraiment. Plutôt, comme le dit Antonio Casilli (à l'origine du signalement sur Twitter) "un social commentary plus qu'un joke". De fait, dans l'histoire de la médecine, l'analyse des fèces et autres matières fécales fut pendant longtemps l'un des principaux pourvoyeurs de "datas" sur l'origine, la propagation et le diagnostic de certaines maladies.

A l'heure donc des #BigData et de la médecine 2.0, il n'est ni très étonnant ni très improbable que dans le spectre des données analysables, la nature / composition / fréquence / consistance de nos selles soit également prise en compte. D'ailleurs les auteurs de ces "quantified selles" dressent une liste parfaitement crédible et objective des possibilités d'analyse liées : détection de grossesse, détection de prise de drogue, analyse d'alcoolémie, infections diverses, etc.

Anal

Le tout de manière parfaitement "non-intrusive", gratuite, privée, etc.

Anal2

Le stade anal de l'âge social ?

Par l'un de ces retournements dont la technique a le secret, nous voilà donc ramenés, via ces Quantified Toilets à la préhistoire de la médecine.

Nous voilà également, sur un plan plus métaphorique, remis devant une évidence que nous cherchons trop souvent à masquer : les données, c'est souvent de la merde.

Nous voilà enfin de retour à une sorte de stade anal du quantified self, point culminant d'un autre stade que l'on eût dit social.

Psychanalyse des rêves Datas

Assumant le reproche qui me sera peut-être fait de donner dans la psychologie de comptoir, je suis nonbstant convaincu que le rapport que nous entretenons aujourd'hui avec nos données peut être étudié à la lumière de la description freudienne du stade anal (ci-après le descriptif donné par Wikipédia) :

"Selon la théorie freudienne (…) l'enfant découvre le plaisir que lui procure le fait de retenir les matières fécales (rétention) ou de les expulser (défécation). (…) la perte des excréments est assimilée, par le jeune enfant, à la perte d'une partie de son corps ; l'enfant peut en être angoissé. (…)

Vers deux ans, l'enfant commence à maîtriser ses sphincters, et l'anus devient (…) une zone érogène sous l'influence de l'exigence de propreté exprimée par les parents. L'anus, zone de passage entre l'intérieur du corps et le monde extérieur, est soumis à la volonté de l'enfant qui s'aperçoit qu'il peut empêcher l'expulsion et en retire donc un plaisir de rétention découlant de l'application de sa volonté. Il prend progressivement conscience du soulagement lié au fait de laisser sortir : c'est la découverte du plaisir d'expulsion. Selon cette théorie, il est fréquent que l'enfant s'intéresse à ses selles et les manipule, les explore ou les exhibe (comme il le fait également avec ses jouets)."

Je remplace maintenant :

"l'individu connecté découvre le plaisir que lui procure le fait de retenir ses données (rétention) ou de les expulser (défécation). (…) la perte des données est assimilée, par l'individu connecté, à la perte d'une partie de son corps ; il peut en être angoissé. (…)"

Je vous laisse continuer à votre guise mais les résonances ne s'arrêtent pas là : les réseaux sociaux ont imposé une sorte de figure maternelle, membranaire, "zone de passage entre l'intérieur du corps et le monde extérieur" qui stimule les deux aspects pulsionnels dudit stade anal, à la fois "dans le plaisir de rétention (ou de dissimulation)" de certaines de nos données, mais également dans "la conscience du soulagement liée au fait de laisser sortir et de la découverte du plaisir d'expulsion." Il est dès lors fréquent que nous nous intéressions à nos données à grands coups d'Open Data et autres DataViz, tels des enfants du nouvel âge numérique là où de toute éternité d'autres enfants "s'intéressent à leurs selles et les manipulent, les explorent ou les exhibent (comme il le font également avec leurs jouets)." Sauf qu'une classe "d'enfants" de 35-45 ans en costume-cravate qui jouent avec leur "caca-data" (et même parfois avec celui des autres …), de suite, ça va vous donner un autre regard sur le prochain interlocuteur qui viendra vous vendre du Dataviz séminaire et de l'Open Data camelotte 🙂

Plus sérieusement, nous avons développé avec nos interfaces et terminaux (sociaux) un rapport de l'ordre de l'affectif et avec nos données (sociales également) des routines psychologiques de l'ordre du pulsionnel. Et réciproquement. Et si vous n'êtes pas convaincus je vous annonce que :

  • votre disque dur vient de cramer et vous n'aviez aucune sauvegarde dans quelque cloud que ce soit
  • votre téléphone portable a été volé et remis à la personne que vous détestez le plus au monde
  • votre compte facebook vient d'être piraté

Si ces 3 nouvelles vous laissent parfaitement de marbre, alors tout ce que je viens de dire est effectivement erroné. Sinon …

Sinon, toujours d'après la théorie freudienne, l'enfant peut s'opposer à sa mère "en retenant (son caca), c'est le développement d'un sentiment de toute puissance." Et là j'arrête de filer la métaphore, parce que précisément, cela ne marche plus, ou plus exactement, cette toute puissance de la rétention des datas est parfaitement illusoire. Voici pourquoi.

La femme qui ne voulait pas qu'on sache qu'elle était enceinte. Et l'antilope.

Une histoire tourne depuis ces derniers jours en boucle dans les médias, celle de cette future mère qui souhaitant dissimuler sa grossesse pour ne pas être exposée à de multiples sollicitations publicitaires, en est devenue suspecte. Cet extraordinaire cas d'école nous apprend plusieurs choses.

Primo : qui sont les puissants. La véritable "toute puissance", au sens non plus freudien mais Orwellien est dans les mains de GAFA (Google Amazon Facebook Apple) et non en les nôtres, même si nous nous escrimons à affirmer ladite toute puissance supposée en "retenant" ou en tentant de dissimuler (nos données). 

Deuxio : quel est leur catéchisme. La pseudo doctrine de Google, telle qu'édictée successivement par Eric Schmidt ("Si vous faites quelque chose et que vous ne voulez que personne ne le sache, peut-être devriez-vous déjà commencer par ne pas le faire" et "seuls les criminels se soucient de protéger leurs données personnelles") ou Vinton Cerf ("la vie privée est une anomalie"), que cette pseudo-doctrine est avant tout un catéchisme, c'est à dire "l'exposé officiel des articles de la foi."

Tertio : l'existence ne précède pas nécessairement l'essence. Oui je sais là c'est un peu plus compliqué donc je vais m'expliquer en plusieurs temps. J'y vais.

Avant que l'homme de demain ne soit "connecté, imprimé en 3D et open source", l'homme d'aujourd'hui est un document comme les autres, vieille théorie expliquée ici et à laquelle un journaliste du Wall Street Journal vient de fournir une parfaite et exemplaire illustration que voici que voilà :

Homme-document

 

Je garde donc l'histoire de "la femme qui ne voulait pas qu'on sache qu'elle était enceinte" et j'y ajoute le fameux exemple de l'antilope de Suzanne Briet, c'est à dire, pour faire simple :

l'antilope qui court dans les plaines d'Afrique ne peut être considérée comme un document. Mais si elle est capturée et devient un objet d'étude (via ses diverses "documentations"), on la considère alors comme un document. Elle devient une preuve physique.

Et je relis / relie le tout à l'aune, donc, de ma théorie sur l'homme est un document comme les autres.

J'observe alors, dans le cas de "la femme qui ne voulait pas qu'on sache qu'elle était enceinte", que c'est, pour ainsi dire, son refus de se documenter elle-même, ou tout au moins sa dissimulation délibérée d'éléments permettant d'y parvenir, qui l'a automatiquement placée dans un tout autre cycle documentaire, un tout autre profil, beaucoup plus flippant pour elle (et pour nous qui découvrons son histoire) mais beaucoup plus cohérent et beaucoup plus "routinier" pour les algorithmes qui nous gouvernent : celui d'un individu ayant des choses à cacher, et donc suspect, et donc potentiellement coupable. C'est à dire le catéchisme cité plus haut. Un peu comme si notre antilope, refusant d'être capturée et documentée, se retrouvait automatiquement cataloguée non comme une proie mais comme un prédateur, un guépard par exemple.

Voilà ce que je voulais dire dans mon tertio : "l'existence ne précède pas nécessairement l'essence" :

ce qui "merdoie" dans les BigData c'est qu'une antilope peut se retrouver identifiée comme un guépard.

Alors même que précisément ces systèmes de "Big Data" pouvaient laisser supposer que plus la masse de données collectées augmenterait, plus le profilage serait consistant, et moins les chances de se tromper seraient élevées. Ce qui est précisément le plus grand mensonge des apôtres de ces technologies. Un mensonge mais également un leurre à double tranchant comme le soulignait déjà Jean-Michel Salaun dans ce billet :

"Mieux ou pire, le numérique par ses capacités calculatoires permet de reconstruire des documents à la demande et nous donne l'illusion d'avoir toutes les réponses à nos questions avant même qu'elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines."

En d'autres termes, ces systèmes de collecte et d'agrégation de données (moteurs et réseaux sociaux) sont parvenus à un point qui ne leur permet plus de ne pas documenter chacun d'entre nous, un point qui, de le même manière qu'il les avait il n'y a pas si longtemps amenés à résilier la possibilité d'un anonymat, les conduit désormais supprimer cette tolérance jadis accordée aux quelques happy fews et rares "Data Rebels" de se soustraire par tromperie ou dissimulation à une quelconque tentative de documentation englobante.

Je reformule donc : ce qui merdoie dans les Big Data c'est que les GAFA et consorts préfèreront toujours vous identifier comme un guépard si vous ne souhaitez pas leur indiquer que vous êtes une antilope.

<50MillionsDamis> D'ailleurs en parlant d'antilope et du guépard, je vous rappelle que tous deux sont également soumis au redoutable problème du jaguar. </incise fort habile vous permettant de relire un autre excellent billet non non non ne me remerciez pas>

Et quand ça merdoie à un tel point, il n'y a effectivement rien d'étonnant à ce que l'on aille fourrer son nez (algorithmique) dans les endroits les plus olfactivement éprouvants, dans les toilettes donc, pour y trouver de la merde certes, mais une merde pleine de datas.

Mouches-76102Algorithmes furtifs en quête de Datas.

 

Sur le volet "catéchisme" qui n'est là qu'en tant qu'il sert de prophétie autoréalisatrice, et sur l'affaire des "quantified toilets", cet article de Jennifer Golbeck sur The Atlantic, "What a Toilet Hoax can Tell Us about the Future of Surveillance", devrait achever de vous convaincre au travers des divers scenarios qu'elle évoque (quantified toilets sur le lieu de travail, lors de concerts publics, etc.)

Mieux vaut être à cheval sur les Datas que d'y aller à selles.

In fine, les réseaux sociaux ont numérisé le rituel du "comment allez-vous", lequel rituel, à l'origine :

"permettait de s’enquérir sur un point essentiel pour nos aïeux, l’installation quotidienne sur le trône et de la production qui s’ensuit… La phrase complète était : « Comment allez-vous à selles ? » devenue par corruption : « Comment allez-vous à la selle ? », et enfin : « Comment allez-vous ? »".

CQFD.

 

P.S. ce billet est déjà très long du coup j'use de la ruse post-scriptumesque pour attirer votre attention sur le fait que cette tendance vers la quête, la collecte et l'analyse de données toujours plus "organiques" s'inscrit parfaitement dans la lignée de ce que je décris sous le nom de "World Wide Wear" et du "corps-interface", et qu'il s'agit tout aussi logiquement de la suite – logique – d'un même processus rémanent de documentation, c'est à dire d'organisation, présent dès l'origine du World Wide Web et même un peu avant dans les utopies fondatrices.  Indexer les documents, puis les hommes, puis organiser l'information, puis les hommes, puis se rapprocher du corps, de l'organique, en faire une interface, et toujours indexer, toujours organiser, mais non plus des documents, non plus de l'information, non plus des profils, mais de l'organique, organiser de l'organique, indexer la matière comme on indexait hier l'information. Les objets connectés, la génomique personnelle, le quantified self. Tout cela a du sens. Tout cela fait sens depuis longtemps. Et je confesse qu'il est tout aussi jubilatoire pour le chercheur de voir une à une s'agencer les pièces de cet immense puzzle qu'il est assez raisonnablement terrifiant pour le citoyen de voir vers quelles dystopies probables ces agencements pourraient nous mener à moyen terme.

 

2 commentaires pour “Les données ? C’est de la merde. Justement.

  1. Bonjour, merci pour ce billet drôle et pertinent 🙂 Sur le fond, vous avez bien sûr entièrement raison.
    En revanche je tenais à vous préciser que l’anecdote de cette femme enceinte, si elle est parlante sur le fait qu’il est devenu difficile pour une personne “normalement” active sur les réseaux sociaux de dissimuler sa grossesse ou un autre fait marquant de sa vie privée, est par contre fausse dans sa conclusion : l’article original de mashable était mal écrit et déformait les propos mais a été repris partout avec en plus déformation progressive.
    D’après le témoignage original de cette femme publié par le Time tout ce qui est arrivé en fait c’est que son mari a vu un panneau dans la pharmacie où il était écrit qu’en cas de gros paiement en cash la pharmacie pouvait signaler le cas aux autorités alors qu’il voulait payer avec plusieurs cartes cadeau. Il n’est pas vrai que ces gens aient vraiment été considérés comme suspects.
    ça n’est pas parce que ça n’est qu’une rumeur que le fond de votre propos est faux, mais surtout le fait qu’elle ait pas mal pris est intéressant en soi 🙂
    article original de Mashable, où on comprend pas bien où est la démo : http://mashable.com/2014/04/26/big-data-pregnancy/
    récit par Janet Vertesi elle-même dans Time : http://time.com/83200/privacy-internet-big-data-opt-out/
    ex de déformation dans Metronews : http://www.metronews.fr/info/vie-privee-soupconnee-d-activite-criminelle-pour-ne-pas-avoir-souhaite-parler-de-sa-grossesse-sur-internet/mnee!EAvSzEW0BaNkU/

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut