La problématique principale des "Big Data" est précisément qu'il n'y a pas de problématique des "Big Data". Les "Big Data" ne sont pas un problème mais créent des zones de tension à l'origine de problèmes dans les champs – scientifiques, techniques, économiques – qui utilisent, produisent ou collectent lesdites données.
Cela est connu mais on a parfois la chance de tomber sur un article absolument lumineux qui dit clairement et en une seule fois ce que trop de gens essaient trop souvent de dire trop maladroitement ou improprement. En l'occurence, cest article c'est celui de Valérie Peugeot, à lire sur Vecam et intitulé : "Données personnelles : sortir des injonctions contradictoires".
Diagnostic.
Je vous en livre quelques courts extraits pour attester qu'elle livre :
- le bon constat : "plus notre économie inventera des services qui auront besoin de s’appuyer sur de la donnée pour fonctionner – et nous en voyons fleurir tous les jours – plus nous mettrons en place les infrastructures passives qui rendent les logiques de surveillance techniquement possibles, quel que soit le tiers qui décide de s’en servir."
- le faux problème : "vouloir empêcher le recueil de données, c’est bloquer l’innovation, et donc freiner l’économie numérique. (…) tout renforcement de la protection des données personnelles peut apparaître comme un frein à la création de nouveaux services."
Et si vous voulez lire l'exemple archétypal de l'article qui se prend les pieds dans le tapis de l'argumentaire dénoncé par Valérie Peugeot, c'est celui-ci ("crise de confiance dans la data", gnagnagna, "protéger nos données sans bloquer l'innovation", oh oui vraiment c'est cromignon).
- ce qui n'est pas négociable (mais c'est pas grave ou en tout cas pas autant qu'on le dit) : "Toutes les données ne sont certes pas personnelles (ex : les données météos ne le sont pas), mais de plus en plus de données entreront dans ce régime, ce qui renforce le risque de surveillance."
Problèmes.
Elle souligne ensuite les impasses ou 3 voies à ne SURTOUT PAS suivre :
- Régulation par le droit : "Cette situation accule à une vision « innovation contre vie privée », qui pousse le droit, dans une course sans fin, à galoper derrière l’innovation sans jamais être à temps pour protéger les utilisateurs. C’est une approche défensive peu efficace dans une période d’affaiblissement de la puissance publique face aux acteurs du marché."
- Régulation par la propriété intellectuelle : "La seconde impasse consisterait à vouloir glisser vers un régime de propriété (intellectuelle et/ ou commerciale) des données par l’utilisateur."
- Régulation par la technique : "La réponse technique à un problème rendu possible par la technique est une course en avant sans fin, qui tend à éluder le fait que le numérique est un produit éminemment socio-technique. Pas plus que les DRM ne sauvent des industries culturelles qui refusent de prendre la mesure de la profondeur de la mutation à l’œuvre en matière de circulation des œuvres, la cryptographie ou autre solution technique ne saurait être une réponse à une problématique socio-économique. Il y aura toujours une technologie capable de défaire la précédente."
Solutions.
Et elle enchaîne ensuite avec 4 vraies bonnes pistes de propositions concrètes pour résoudre un problème dont l'insolvabilité apparente n'atteste que de notre incapacité à en poser correctement les termes :
- 1. économie servicielle :
"orienter l’économie numérique le plus loin possible de l’économie de l’attention pour revenir à une économie servicielle." Excellentissime idée, à condition de l'appliquer rapidement, faute de quoi les mêmes acteurs se positionneront sur ladite économie servicielle avant que nous ayons eu le temps de dire ouf et disposeront alors d'une puissance décuplée (cf plus loin dans ce billet à propos des projets bancaires de Facebook). J'ajoute que le web des objets (world wide wear) constitue une opportunité importante d'effectuer cette bascule vers une économie serivcielle. Là encore à condition de ne pas les laisser faire le premier pas et se positionner sur l'essentiel des services liés.
- 2. documentation technique :
"passer par une obligation de documentation technique très forte (qui) serait le support à l’intervention d’un corps d’inspecteurs des données, dont les prérogatives iraient bien au-delà de celles de la CNIL". Je signe des deux mains et j'ouvre une licence pro dédiée à la formation desdits inspecteurs.
- 3. Open source :
chercher, à l'opposé de la cryptographie, "du côté des infrastructures ouvertes et libres".
- 4. Commons :
"développer une sphère de données en Communs, c’est-à-dire de données qui peuvent être considérées comme une ressource collective, et qui n’entrent ni dans le régime des biens gérés par la puissance publique strico sensu, ni dans un régime de marché. Ce régime de Communs repose sur une gestion par une communauté de la ressource considérée, qui organise ses règles de gouvernance, en s’appuyant sur un « faisceau de droits » (bundle of rights »). Ces faisceaux de droits rendent possibles des régimes de propriété partagée. Un faisceau de droit c’est un ensemble de relations sociales codifiées autour de quelque chose à protéger"
Chacune de ces 4 pistes est développée, argumentée et nourrie d'exemples concrets. Vraiment précipitez-vous lire ce texte de Valérie Peugeot, vous en sortirez grandis 🙂
J'avais moi-même, dans cet ancien billet d'Octobre 2013 : "Bien éclairés : données, consentement, communs", insisté sur l'importance de faire de nos données des biens communs et développé quelques pistes pour y parvenir.
Mais revenons un instant au titre de ce billet :
"Big Data Fatwa".
D'abord pour rappeler qu'une "Fatwa" n'est pas du tout une condamnation à mort mais :
"un avis juridique donné par un spécialiste de loi islamique sur une question particulière. En règle générale, une fatwa est émise à la demande d'un individu ou d'un juge pour régler un problème où la jurisprudence islamique n'est pas claire. Un spécialiste pouvant donner des fatwas est appelé un mufti. Contrairement à l'opinion répandue par les médias, une fatwa n'est pas forcément une condamnation. Il s'agit d'un avis religieux pouvant porter sur des domaines variés : les règles fiscales, les pratiques rituelles ou encore l'alimentation." (Source : Wikipedia)
Et ensuite pour expliquer que si les solutions préconisées par Valérie Peugeot (et quelques autres) ne sont pas rapidement mises en oeuvre, nous allons nous en prendre une de bonne de Fatwa, une de celles que le sens commun associe exclusivement à une condamnation à mort, en l'occurence sinon notre mort, à tout le moins notre future inexorable aliénation datacentrique.
Les ayatollah de la Data.
Car à côté des gentils Muftis comme Valérie, se multiplient les Ayatollahs de la Data et autres mollahs pro ou anti-Privacy. Pendant que le Guardian et le Washington Post récoltent le Pulitzer, Snowden et Assange sont toujours poursuivis et Manning purge 35 ans de prison. Et chacun y va de sa Fatwa, c'est à dire d'un avis ou d'une stratégie directement corrélés non pas à la réalité mais à ses propres croyances ou intérêts. Quelques exemples :
- Ayatollahs du marketing.
Là encore je me contente de vous renvoyer à l'excellente enquête d'Yves Eude sur Le Monde : "Comment notre ordinateur nous manipule". Quelques extraits :
"en trois clics, vous voilà fiché 108 fois par une quarantaine de bases de données. Si vous commencez à acheter le téléphone mais abandonnez en cours de route, vous serez repéré par la société française Criteo, spécialisée dans le « reciblage ». Des publicités pour le produit que vous avez failli acheter s'affichent sur votre écran pendant des jours, et vous suivront sur tous les sites que vous visiterez. Criteo a besoin de machines puissantes : pour identifier un internaute, contacter la plate-forme qui gère ses espaces publicitaires, proposer un prix, conclure l'affaire et lancer l'affichage de la bannière, elle dispose de 13 centièmes de seconde – faute de quoi l'espace sera vendu à un concurrent. Entreprise de taille moyenne, Criteo reçoit 20 teraoctets (vingt mille milliards) de données par jour, et touche 850 millions d'internautes par mois, certains des centaines de fois. (…)
Pour influer sur nos cerveaux, les publicitaires disposent d'une énorme puissance de calcul. Ils emploient des mathématiciens pour concevoir les algorithmes, des développeurs pour les traduire en langage informatique, des ingénieurs pour construire l'architecture des bases de données, des analystes pour capter et exploiter des données …
(…) L'espoir suprême des chercheurs est que les ordinateurs donnent du sens à des données diffuses et chaotiques, livrées en vrac. En découvrant des modèles et des corrélations qu'aucun humain n'aurait imaginé, ils répondront à des questions que personne ne leur a posées."
Article auquel j'ajoute cette remarquable approche du Financial Times avec une infographie participative très pédagogique sur la valeur réelle de nos données personnelles (moins d'un dollar pour un individu "normal")
- Ayatollahs du monopole algorithmique.
Et paf, nouvel article saignant, signalé et résumé dans le tout nouveau site de feu la rubrique "A lire ailleurs" d'Internet Actu.
- Ayatollahs du coût zéro.
Facebook et Google (et quelques autres mais surtout ces 2 là) sont lancés dans une course éperdue pour proposer un accès internet haut-débit à coût zéro aux prochains milliards d'internautes connectés. Le retour à une économie servicielle prôné dans l'article de Valérie Peugeot est le seul à pouvoir limiter les risques afférents à des écosystèmes propriétaires (Google et Facebook donc) devenus des internets de substitution, ou simplement les fins d'internet.
- Ayatollahs de la documentation.
Un autre article a récemment pas mal tourné, relatant la cérémonie des clés de l'Icann où 14 personnes détiennent 7 clés permettant d'accéder à la base de donnée de l'Icann, sorte de paradigme classificatoire, d'Index Mundi à côté duquel la classification Dewey ressemble à un foutoir organisé. <incise inutile, just for fun> Pour un enseignant en "sciences de l'information", c'est toujours un délicieux vertige quasi orgasmique de constater que la totalité du web repose sur un fichier d'index inversé associant des chiffres – cabalistiques adresses IP – à des noms – déclaratifs noms de domaine. Bref de constater que les régulations des plus avancées des technologies les plus modernes demeurent réductibles et irréductiblement liées à une technologie de repérage, d'association et de correspondance inventée dans les 1ères bibliothèques de la haute antiquité. </incise inutile, just for fun>
- Ayatollahs de la peur.
Ceux qui nous promettent l'invasion des profanateurs de Data, "Invasion of the Data Snatchers." <Rien à voir mais ça m'a fait rire jaune> D'autant que sur le marché aussi porteur qu'émergent de la mort numérique, la profanation de sépulture prend des tournures inattendues … </je vous avais prévenu que ça n'avait rien à voir>
Prends la Data et tire-toi.
En essayant de ne pas sombrer moi-même dans les travers ayatollesques que je dénonce, je voudrais rappeler tout de même l'urgence à cesser les imprécations et à se sortir les doigts du monastère du numérique au profit d'une imposition des mains sur le ministère de la chose publique, et réciproquement.
<HDR> Pendant longtemps, les maîtres de la Data n'avaient pas de nom. Ils n'avaient pas de visage. C'était le monde de la finance. Ah non pardon, celle-là on vous l'a déjà faite. Je reprends. Pendant longtemps, les maîtres de la Data c'étaient les banques et les banquiers. Seul mon banquier, à l'aide des données minutieusement captées par ma carte bleue, pouvait savoir que tel jour j'étais en terasse d'un bar nommé "La tireuse" à Toulouse en train de battre le record absolu de descente de demis en terrasse ; lui seul pouvait savoir la nature, l'heure et le coût de l'ensemble de mes achats, seul lui pouvait pister chacun de mes déplacements autoroutiers au travers des différents retraits effectués au péage avec la même carte bleue. Et tant d'autres choses encore.
Puis, phase 1, vinrent l'internet, les moteurs de recherche, les réseaux sociaux, et maintenant les Big Data.
Puis, phase 2, le modèle documentaire se sentit des attirances avec celui de la finance, celui de Trading haute fréquence, une documentation haute fréquence.
Et là on est tranquillement en train de passer à la phase 3. Selon les révélations du Financial Times, "Facebook pourrait lancer des services bancaires en Irlande" (voir aussi l'article de ZDNet sur le sujet). Et oui. Déjà qu'il est possible de payer par effleurement ("sans contact"), de faire circuler de l'argent en pièce jointe, pourquoi ne serait-il pas possible de s'installer en douceur sur le marché juteux des services bancaires ? Pourquoi Facebook se priverait-il de mettre en application la contre-mesure de l'économie servicielle préconisée par Valérie Peugeot ? Puisque si lui (et ses acolytes) sont les premiers à l'appliquer, le formidable potentiel de ce qui aurait pu être une contre-mesure efficace s'avèrera in fine complètement désamorcé du fait de la prime au premier entrant (= on ne pourra plus "servicialiser" ce secteur puisque quelques acteurs – toujours les mêmes – l'auront fait avant). Dit autrement par Nicolas Colin : "il n’est plus possible de partir à l’assaut d’une filière une fois que sa transformation numérique est achevée."
Métaphore Méta Fort Knox de la data.
Pour achever leur mue, pour atteindre la fin d'un cycle, il est évident, comme en attestent notamment les quatre précédents liens, que moteurs et réseaux sociaux leaders, que ces biotopes attentionnels vont se positionner comme de nouveaux banquiers pour assurer une triple cohérence :
- cohérence métaphorique :
Les données comme nouvel or noir, nouveau "pétrole" numérique), avec les limites inhérentes à toute approche métaphorique.
- cohérence économique :
La gratuité associée à l'économie de l'attention ne tiendra pas aussi longtemps que nos impôts, il va falloir trouver des services à vendre pour rester leader et continuer de pouvoir maintenir dans une "bulle gratuite" certains services tout en tablant sur un coût zéro de la connexion et de l'accès porté par ces mêmes opérateurs.
- cohérence socio-technique :
Un empire économique construit sur des données et des externalités circulantes (les documents puis les profils) ne peut que logiquement et irrévocablement être amené à s'intéresser à la première de ces externalités, c'est à dire la monnaie, l'argent, la thune, la pompe à phynance. Plus que du pétrole, les données sont avant tout une monnaie. Et qui mieux que ces biotopes attentionnels est aujourd'hui capable de battre monnaie ? On rejoint alors la thèse que je défendais dans le billet "Le web en lettres Capital : pour une théorie marxiste du document" :
"Parvenu à son plus haut degré d'achèvement (…) ce néo-libéralisme linguistique va chercher à augmenter encore ses marges en introduisant une couche supplémentaire de dérégulation documentaire (…) qui s'appuiera (…) sur la dévalorisation (…) des documentations liées au "travail", (…) au profit des documentations liées au capital (c'est à dire les documentations directement issues des régies publicitaires structurant le capitalisme linguistique), le stockage dans le nuage (cloud computing) de ces "valeurs" faisant office de banque : gérant le stock et assurant la (dé)régulation du flux."
En plus de tout le reste et si les solutions préconisées par Valérie Peugeot ne sont pas rapidement mises en oeuvre, nous pend au nez une prochaine et radicale dévaluation monétaire orchestrée par ces nouvelles banques centrales que sont les GAFA (Google Amazon Facebook Apple), c'est à dire une dévaluation de nos données. Pour continuer de filer la métaphore économique, l'un des éléments déclencheurs de cette dévaluation comme le fut pour la monnaie le choc pétrolier de 1974, sera l'avènement du web des objets (World Wide Web). A cette différence près (et oui, on a changé d'économie), que là où le choc pétrolier stigmatisait une logique de rareté, le web des objets stigmatisera une logique d'abondance (30 milliards d'objets connectés en 2020, représentant 44 000 milliards de giga-octets de données).
A noter que dans un autre registre mais toujours dans le domaine du croisement de l'exploitation des données (de consommation) et de la montée en puissance d'une économie de service associée, Amazon vient de lancer Amazon Fresh, s'attaquant directement aux hypers(marchés) via la livraison de produits frais. Facebook et la banque, Amazon et les produits frais … ça commence quand même à faire un sérieux faisceau d'indices concordants non ? </HDR>
Un petit résumé pour conclure ?
Oui, ce sera celui que Valérie Peugeot fait de son propre article :
"Refus de la propriétarisation de la donnée, déplacement du capitalisme informationnel vers une économie servicielle, montée en puissance des infrastructures ouvertes de recueil et traitement des données personnelles, développement d’une sphère des données en régime de Communs, construction d’un droit des données personnelles appuyé sur un « faisceau de droits d’usage »… Chacune de ces pistes vise à empêcher la construction d’une société de surveillance. Certaines sont déjà en cours d’exploration. A nous de multiplier les recherches et de faire se rencontrer les acteurs qui œuvrent à une sortie par le haut de la société des données de masse. Pour que données puisse rimer avec libertés."
Je vous ai déjà dit que la lecture de cet article était absolument indispensable ? Bon. Alors qu'est-ce que vous faites encore ici ?
Merci (comme toujours). L’article de Valérie Peugeot est une très belle découverte. Pas sûr, par contre, que la « fatwa » sera entendue des autorités. Le marché sera probablement plus prompt à réagir. Serait-ce prêcher dans le désert pendant que les marchants sont en train de mettre un 2ème étage dans le temple?(pour rester dans la métaphore)