L’archive épidémique

J'ai souvent sur ce blog écrit au sujet de la mémoire. Du rapport à la mémoire que modifie, structurellement et conjoncturellement le numérique (notamment "Funès ou la mémoire : le web hypermnésique" en Janvier 2009, "Nos mémoires ne valent pas un Cloud" en Juin 2011, "Total Recall : Silico Transit Memoria Mundi" en Septembre 2011, "La mémoire et l'amer" en Novembre 2011, "Le jour où Youtube fermera" en Février 2012, "Extented Memories : l'avenir du Search" en Avril 2015)

Total Recall.

Pour le dire rapidement, mon hypothèse était que le numérique changeait radicalement notre rapport à l'archive et au patrimonial (avec l'émergence de l'idée d'un "patrimoine du temporaire"). Comme il devenait impossible de "faire le tri" en amont pour savoir quoi archiver, comment le faire et pour combien de temps, il fallait changer de paradigme archivistique et tout prendre, tout capter, tout conserver, à charge ensuite pour les citoyens et les chercheurs, grâce aux outils numériques du Big Data et de la linguistique de corpus (notamment), de venir extraire de ces gigantesques archives ce dont ils avaient besoin pour comprendre les processus sociaux, politiques et historiques d'une période donnée et pouvoir leur (re)donner du sens. 

L'un des exemples qui m'accompagnait souvent dans cette analyse et que je continuais de donner en exemple à mes étudiant(e)s était celui de la Bibliothèque du Congrès (LoC). Nous étions alors le 14 Avril 2010 et une dépêche AFP venait de tomber en indiquant que ladite bibliothèque du Congrès (LoC) "accueillerait les milliards de messages postés sur le site de microblogs Twitter depuis son lancement en mars 2006." L'annonce était simultanément faite sur le blog de la LoC.

Annonce tonitruante dont on peine, 8 ans plus tard, à mesurer l'ampleur, et bouleversement que j'avais commenté dans l'article "Twitter : un patrimoine superflu(x) ?" et où je rappelais que nous nous rapprochions de la vision de l'archive telle que définie par Foucault :

"Par archive, j’entends d’abord la masse des choses dites dans une culture, conservées, valorisées, réutilisées, répétées et transformées. Bref toute cette masse verbale qui a été fabriquée par les hommes, investie dans leurs techniques et leurs institutions, et qui est tissée avec leur existence et leur histoire." Michel Foucault, Sur l’archéologie des sciences (1968)

Et que ce rapprochement ouvrait beaucoup plus de problèmes qu'il ne permettait d'envisager de solutions.

Archive au choix.

Il y a un mois, le 26 décembre 2017 la Bibliothèque du Congrès annonçait sur son blog qu'elle allait revoir complètement cette logique d'archivage de Twitter, pour en revenir à un mode plus "classique", c'est à dire sélectionner et choisir des Tweets en fonction d'événements historiques (élections par exemple) ou de personnalités reconnues. Le site Actualitté titrait en commentaire de cet événement : "Peut-être n'est-il pas nécessaire d'archiver tous les tweets du monde." Dont acte. 

En l'état la bibliothèque du Congrès conservera donc l'archive "complète" des comptes publics constituée de 2006 à 2010 ainsi qu'une archive permettant de documenter les années 2010 à 2017, et pour le reste la nouvelle politique d'archivistique à l'échelle de ce patrimoine du temporaire sera sélective ("The Library will work with Twitter to acquire tweets on a selective basis.") Le document de la LoC précise :

"the tweets collected and archived will be thematic and event-based, including events such as elections, or themes of ongoing national interest, e.g. public policy."

Et rappelle aussi qu'à la différence des archives mises publiquement à disposition par la LoC, y compris des archives du web, l'archive Twitter reste pour l'instant "sous embargo" afin de régler différents problèmes d'accès et de respect de vie privée (mais aussi peut-être un peu de modèle économique). 

"The Library will also engage with Twitter to resolve issues associated with managing transactions that generate deletions of tweets, and user access issues. The Twitter collection will remain embargoed until access issues can be resolved in a cost-effective and sustainable manner."

La LoC adopte donc une logique de traitement et de constitution des archives plus "classique", à l'image de ce que fait, par exemple, le dépôt légal du web de la BnF en France : on choisit et on sélectionne des hashtags et des comptes en lien avec un événement donné pour les verser dans une collection archivistique ad hoc.

Archiver les erreurs des moteurs.

Robert Epstein est un scientifique, psychologue de Harvard, notamment connu pour sa description et sa démonstration, en 2014, d'un effet de manipulation des moteurs de recherche, particulièrement problématique dans des périodes d'élection : le Search Engine Manipulation Effect. Dans une interview récente à The Outline, reprise et chroniquée par Numérama, il explique que pour pouvoir établir et prouver la responsabilité des moteurs de recherche dans certains cas de résultats faux, faussés ou problématiques (notamment en période électorale mais pas uniquement), et ces résultats étant en général corrigés après coup via différentes mises à jour algorithmiques faisant du même coup disparaître toute forme de "preuve", il faut construire une archive publique et consultable de – certaines – de ces pages de résultats. 

Je reprends ici la conclusion de l'article de Numérama

"Il faut que nous puissions voir et enregistrer ce que les algorithmes montrent aux gens. Regarder le code ne sert à rien : il faut qu’on puisse voir ce que chacun visualise sur son écran » conclut Robert Epstein. L’équipe dédiée à ce projet a notamment archivé plus de 13 000 recherches Yahoo, Google et Bing liées à l’élection présidentielle américaine entre mai et novembre 2017, ainsi que les près de 100 000 pages de résultats liés. Elle espère convaincre de la viabilité de son système pour rendre les géants de la tech plus responsables."

Argent trop cher, archives aussi.

Depuis Novembre 2017 c'est une annonce et un projet du gouvernement qui faisait réagir la communauté des archivistes et bibliothécaires. Le projet consistant à économiser de l'argent et donc à détruire et à ne plus collecter et conserver autant d'archives. Pour plus de détails on pourra se reporter à cet article d'Actualitté ou bien encore à l'excellente émission qu'Arrêt sur Images a consacré à ce sujet mi-janvier 2018.  

Archiv

Archiver tout Twitter, archiver les moteurs, archiver … l'essentiel.

Trois histoires donc. 

Celle de l'archivage exhaustif de Twitter devenu impossible par la volonté de la puissance publique, fut-elle la Bibliothèque du Congrès.

Celle de l'archivage et de la conservation des résultats des moteurs de recherche afin de pouvoir documenter non seulement leurs erreurs (et donc d'établir leurs responsabilités) mais également l'évolution de notre propre rapport à l'information.

Et celle de la question des économies que la "puissance publique" souhaite réaliser autour de ce qu'elle nomme sans vraiment les définir comme étant des "archives essentielles". 

Ces trois histoires posent en creux le cadre d'une réflexion urgente sur la manière dont ces espaces semi-publics et semi-privés que sont moteurs de recherche et réseaux sociaux peuvent ou doivent entrer dans le champ d'une conservation et d'une mise à disposition. Réflexion qui doit également porter sur la nature de cette conservation et ses modalités d'accès et de collecte : faut-il des archives complètes, partielles, sélectives (et sur la base de quels critères ?). 

L'un des premiers axes de cette critériologie est bien sûr la question de l'articulation entre ce qui a vocation à devenir public (et donc archivé) et ce qui doit rester privé.

Sur l'épineuse question de "la nature publique ou privée d'une source web", la page du dépôt légal du web de la BnF indique (je souligne) :

"Le dépôt légal s’applique à ce qui est considéré comme publié, c’est-à-dire mis à la disposition du public, en ligne ; les échanges à caractère privé ne sont pas concernés. Les sites, blogs, voire les parties publiques de réseaux sociaux, sont donc soumis au dépôt légal, à l’inverse des courriels, des espaces privés des réseaux sociaux ou des sites intranet qui en sont exclus. C’est la nature du destinataire qui indique le caractère public ou privé : dès que le destinataire doit être spécifiquement agréé par l’émetteur du site (par exemple par réception d’un mot de passe ou par acceptation comme membre d’un réseau), le document est d’ordre privé."

Cette règle archivistique est claire – au premier degré – et chacun voit bien qu'elle permet de ne pas archiver, par exemple, les contenus circulant via Messenger. Mais même en se limitant aux deux plateformes que sont Facebook et Twitter, on pourrait avoir des heures de débat sur le fait que tel ou tel "post" ou "tweet" relève de la "partie publique" du réseau ou de son "espace privé", et a fortiori lorsque la même règle archivistique stipule que le document est d'ordre privé dès lors qu'il suppose "l'acceptation comme membre du réseau" ou "la réception d'un mot de passe". A ce titre et toujours au premier degré, la totalité des contenus des plateformes seraient donc hors-champ de toute forme d'archive publique.

Archive épidémique ou épidémie d'archives.

Il est naturellement impossible de "tout" conserver et de produire l'archive Foucaldienne évoquée plus haut. Tout comme il est impossible de laisser hors-champ de l'archive et du patrimoine la totalité des logiques de production et de réception d'information à l'oeuvre dans les grandes plateformes. Et il est vital que la puissance publique soit en capacité de constituer et de rendre accessible cette archive car en laisser le seul soin à des acteurs privés serait une pure folie culturelle et politique.  

On pourrait imaginer qu'il existe en fait deux "situations", deux visions de l'archive à l'échelle d'une société : une perception endémique de l'archive, et une perception épidémique de l'archive.

La perception endémique désigne la présence habituelle d'un habitus archivistique dans un secteur ou sur un volet patrimonial donné. On "sait faire" une archive et l'on sait "à quoi sert" la même archive (et pourquoi donc on la constitue de telle ou telle manière).

La perception épidémique de l'archive désignant alors l'augmentation inhabituelle et subite du nombre d'information à archiver existant à l'état endémique dans un secteur ou sur un volet patrimonial donné. Cette perception épidémique de l'archive est consubstancielle de l'émergence de chaque nouvelle grande plateforme du web, de chaque nouvelle "collection" ainsi rendue publique ou semi-publique. Lorsqu'apparaissent YouTube, FlickR, Twitter, Facebook et tant d'autres, elles font simultanément basculer nombre de certitudes archivistiques, non pas tant par l'échelle industrielle à laquelle il est nécessaire de se placer pour traiter ces nouveaux contenus (cela les bibliothèques ont appris à le faire), mais du fait des incertitudes qui accompagnent et traversent à la fois les usages et la dimension pérenne de ces plateformes, et du fait également du statut des contenus qui y sont produits et accédés.

Quand YouTube s'est constitué (Février 2005), et qu'il n'était composé que de contenus piratés ou de films amateurs de mariages, la question de l'archive ne se posait pas. Treize ans plus tard, chacun voit bien la question que poserait un effacement total de l'archive ainsi constituée. Et on pourrait dire la même chose de tant et tant d'autres services et plateformes. Or si rien ne prouve que ces plateformes disparaîtront prochainement, rien ne prouve davantage qu'elles seront éternelles, et surtout rien n'indique que les modalités de leur accès  – et donc de leur rendu – public n'évolueront pas vers des modes marchands ou bien plus privatifs que ce qu'ils sont actuellement.

Faire confiance à des archives publiques de la vie privée.

Le titre ci-dessus n'est là que pour le plaisir du trouble qu'il jettera – je l'espère – dans l'esprit de mes lecteurs. Mais la question qu'il pose me semble importante. Cette question c'est celle du rôle et de la place qu'entretient aujourd'hui la question de l'archive avec, d'une part la question de la "privacy" qui est probablement l'un des marqueurs les plus constants et signifiants des bouleversements numériques (lire attentivement la dernière tribune D'antonio Casilli et Paola Tubaro dans Le Monde), et avec d'autre part la question de la "confiance" qui permet aux logiques d'archivage de contribuer à renforcer la valeur et la dimension de preuve des documents et items collectés. 

Confiance et "privacy" donc.

Sur la question de la confiance.

Sur la question de la confiance, la réflexion sur les archives ne peut plus faire l'économie d'une réflexion croisée autour des technologies de l'artefact. Réflexion qui pourrait démarrer par le questionnement suivant : dans une société où ces technologies de l'artefact occupent une place prépondérante, où les régimes de vérité sont en situation de concurrence faussée, et où les espaces médiatiques de circulation des idées sont pour l'essentiel des plateformes privées revêtant une valeur d'usage(s) public(s), comment garantir la constitution d'une archive permettant de construire une valeur de preuve collective et un indice de confiance stable ? 

Je n'ai bien sûr pas la réponse mais je sais, comme d'autres avant moi l'ont démontré, que nous courrons à la catastrophe si nous n'y parvenons pas. Et à ce titre, la question posée par Epstein sur l'archivage des résultats des moteurs de recherche me semble tout à fait pertinente. 

Sur la question de la "privacy".

la formule est aussi fausse, dangereuse et démagogique que connue : "Si vous n'avez rien à vous reprocher, vous n'avez rien à cacher." Mais si vous n'avez rien à cacher est-ce pour autant que vous avez tout à archiver ?  

Il faut nous préparer à une société du paradoxe de la dissimulation. Je parle d'un paradoxe mémoriel et donc de l'archive qui en découle. Un paradoxe mémoriel à l'échelle individuelle et collective. Et je m'explique. Enfin j'essaie 🙂

Les iPhones des poilus.

D'un côté, toutes les informations que nous souhaitons garder secrètes pourront l'être mais, à la différence des lettres cachées ou volées que l'on pouvait toujours retrouver des dizaines d'années plus tard pour les verser "aux archives", ce secret ne pourra jamais être levé et ce quelle qu'en soit la valeur historique ou mémorielle. Je vais vous raconter une petite uchronie, mais avant souvenez-vous. 

Souvenez-vous des nombreuses histoires qui ont opposé Apple (fabriquant d'iPhone) à la justice américaine autour du "secret" absolu et inviolable des informations contenus dans l'iPhone utilisé lors d'un attentat, inviolabilité que la requête dûment diligentée par un juge n'avait pas réussi à casser. Je vous avais raconté cette histoire dans une série de billets ("Un terroriste est un client Apple comme les autres" => "Pomme Pomme Pomme Suppr" => "La transparence de cryptes"), billets dont la conclusion était (en gros) la suivante :

"La question à se poser est alors celle-ci : nous avons tous une vie privée, et nous avons tous le droit à une vie privée. Pour autant, dans le cadre d'un état de droit, et dans le cadre d'une procédure judiciaire, si nous sommes accusés ou reconnus coupables d'un acte délictueux, les éléments qui composent et documentent notre vie privée restent accessible via un mandat de perquisition (ordonné par un juge). La question que pose le cryptage par défaut incassable des iPhones et la lettre de Tim Cook aux clients d'Apple est celle de savoir si l'espace – physique ou numérique – alloué aux traces documentaires de notre vie privée doit être imperquisitionnable. S'il doit résister à toute forme de perquisition. (…)

En tant que citoyen et en tant que chercheur travaillant sur la question des traces numériquesje trouve inquiétant qu'il existe ainsi des "boîtes noires", des espaces non accessibles aux requêtes d'un juge dans le cadre d'une enquête criminelle, des espaces "imperquisitionnables". Jusqu'ici, à l'échelle de nos démocraties, aucun domicile, ni même aucun coffre bancaire d'aucune banque (sauf peut-être dans certaines îles des Caïmans, bon et en Suisse aussi d'accord …) ne pouvait se soustraire à un mandat de perquisition en bonne et due forme."

Bref, le droit à la vie privée dans un état de droit ne doit pas être assimilé à un droit au secret délivré et décrété par un fabriquant de Hardware. Je notais également à propos de cette affaire le renversement total opéré par les plateformes dans leur argumentaire autour de la vie privée : 

"Il y a peu, ces mêmes firmes qui nous vantent aujourd'hui l'importance d'offrir un niveau de cryptage absolu sur la moindre de nos communications étaient celles qui nous expliquaient que la vie privée n'existait pas (ou était une anomalie) et que si nous n'avions rien à nous reprocher alors nous n'avions rien à – leur – cacher. Il y a peu, ce qui était suspect était la tentation de préserver un semblant de vie privée ; désormais, ce qui est suspect est de ne pas réclamer à hauts-cris un niveau de cryptage résistant à l'ensemble des agences de renseignement de la planète pour la moindre photo de vacances ou le moindre échange de SMS avec nos proches." 

Et maintenant donc comme promis laissez-moi vous compter une petite uchronie. Imaginez une guerre. Mondiale. L'une des deux dernières par exemple. Et prenez conscience de la masse d'informations dont nous avons pu disposer sur cette période et sur ces guerres grâce aux archives constituées à partir de lettres et de correspondances, privées donc, retrouvées parfois des – dizaines – années plus tard. Imaginez maintenant que lors de ces guerres, soldats et poilus aient eu à leur disposition des iPhones (j'ai dit que c'était une uchronie). Voilà. Nous n'aurions alors rien pu savoir de leur correspondance. Rien du ressenti adressé à leurs proches n'aurait pu nous permettre de faire mémoire.

Le droit à la vie privée ne doit pas être un droit au secret. La valeur et l'intérêt d'une archive ne se mesure souvent que longtemps après les événements qui la composent.   

L'archive génétique.

D'un côté donc, nous sommes aujourd'hui dans une société où chacun peut disposer d'une archive privée définitivement inviolable et imperquisitionnable. Certains s'en réjouissent, d'autres s'en inquiètent (dont moi). Et de l'autre côté, une autre révolution s'amorce avec le fait que les secrets pour le coup les plus intimement biologiques sur notre ascendance et notre héritage biologique, ces secrets inscrits dans la loi et garantis par l'état dans le cadre de la PMA par exemple (anonymat du don de gamètes), ne signifieront plus rien et ne tiendront pas deux minutes au regard des possibilités offertes par la dérégulation et la mondialisation effective du marché de la génomique personnelle. C'est en tout cas ce que vient de démontrer le cas d'Arthur Kermaleven, qui à l'aide du kit fourni par la société 23andMe (une vieille connaissance sur ce blog ;-), d'un site de généalogie en ligne, d'une recherche sur LinkedIn (bon et quand même aussi d'un peu de chance) a retrouvé en quelques jours son "donneur".

Voilà probablement la bascule.

Voilà sensiblement le changement de paradigme. Ce ne sont plus les États qui sont aptes à définir juridiquement et à garantir socialement les conditions du secret (y compris d'ailleurs, pour nombre de "secrets d'état" à l'ère post-wikileaks) mais des opérateurs et des plateformes privé(e)s. Ce sont également les mêmes plateformes et opérateurs privés qui sont chaque jour en capacité de faire archive de notre intimité et de notre vie privée. Et ce sont enfin une nouvelles fois les mêmes plateformes et opérateurs privés qui disposent aussi de la "golden copy", de la copie dorée et originale de nombre de documents à la valeur patrimoniale et publique incontestable.

Cette triple conjonction de faits doit, à tout le moins, nous amener à nous interroger sur notre capacité à faire mémoire en dehors du champ desdites plateformes. C'est à dire, puisqu'il ne peut y avoir de société sans mémoire, à nous interroger sur notre capacité à faire société en dehors de ces plateformes.   

 

 

3 commentaires pour “L’archive épidémique

  1. Bonsoir,
    Une épidémie d’archives….voilà qui va réjouir les archivistes 🙂
    Le numérique, conduit aussi à un glissement sémantique du terme archives dans une double dimension : passage du pluriel au singulier dans l’usage du mot archives et réduction du périmètre de l’archive à ce qui est accessible sur Internet….
    Au delà des questions que vous mettez en avant, il y en a une autre qui mérite notre attention qui est celle de la qualité de la collecte des archives institutionnelles dans un environnement numérique….sous peine d’amnésie
    La question posée par Epstein sur l’archivage des résultats des moteurs de recherche rappelle aussi le rôle premier de l’archive qui est de faire preuve, en tant que trace d’une activité, avant que d’être patrimoine
    Je vous rejoins sur la question du rôle et de la place qu’entretient aujourd’hui la question de l’archive avec la question de la “privacy” qui se joue également en temps que (re)négociation de l’équilibre entre droit à l’oubli et mémoire au travers par exemple de l’anonymisation ou du déréférencement et qui en son temps (2013) s’était exprimé avec la pétition #EUdataP portée par l’association des archivistes français
    La confiance dans l’archive renvoie à la qualité de l’information et donc à notre capacité de critiquer l’information (au sens de la diplomatique)pour justement évaluer sa fiabilité
    Sur les “archives essentielles”, je vous invite aussi à consulter le site de l’Association des archivistes français http://www.archivistes.org/Suivre-le-debat-sur-les-archives-essentielles…car ce débat aura eu le mérite de poser sur l’espace public, la question des archives même si trop souvent cette question n’est traitée que par le prisme de l’archivage du web

  2. à propos de la vie privée et de l’archive. Il existe déjà un système en France en quelque sorte, qu’il serait peut-être bon de dépoussiérer ou explorer.
    Le notaire est un archiviste des biens patrimoniaux d’une personne (famille), il en assure la succession. C’est un gestionnaire de l’histoire familiale. On pourrait tout à fait imaginer que le notariat étende la fonction de son étude à la gestion de certains « biens numériques. » Le gros enjeu probablement étant la compétence des notaires qui pour l’instant est un monde ancré profondément dans le papier avec peu de compétences sur le numérique, si ce n’est juste que pour gérer les communications personnelles par courrier électronique.
    Lorsque la famille pense qu’une partie de ce patrimoine électronique devrait devenir complètement publique, elle pourrait négocier avec un institut de mémoire pour sa gestion ultérieure. Penser correspondances papier, tableaux, collections de livres, etc. dans ce qui se fait déjà.

  3. C’est une erreur de penser que les notaires sont ancrés dans le monde papier. Ils ont accompagné l’avancée du numérique dans notre société et s’y sont parfaitement adapté. Ils proposent par exemple l’acte authentique unique électronique depuis 2012 (une demi-douzaine d’année).

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut