Les pratiques de mise en "cache" de tout ou partie des pages du web font débat depuis longtemps. Le site Internet Archive repose tout entier sur cette mise en mémoire de l’Internet. Les pages conservées le sont dans un but "bibliothéconomique" de conservation patrimoniale. Même si la question d’Internet comme "patrimoine du temporaire" est loin d’être résolue, la politique de conservation d’Internet Archive est relativement claire. D’autres acteurs, les moteurs de recherche, utilisent également cette fonction de cache. Historiquement, c’est Google qui fut le premier à la mettre en place, faisant la joie de quelques veilleurs et netchercheurs, et le dépit de quelques individus ou de quelques entreprises peu prévoyantes … Yahoo! lui emboîta récemment le pas, en proposant également de chercher les versions antérieures de pages de résultats. La question que pose cette pratique pour les moteurs de recherche est celle du "droit à l’oubli." "Je cherche un travail mais j’ai un passé politique troublé" n’est que l’un des scénarios qui font du Name Dropping sur Google une pratique délicate. Sur Google et non sur Yahoo car le cache de ce dernier renvoie explicitement vers le site Internet Archive (dont sont issues les copies conservées en cache sur Yahoo), et donc vers la politique de conservation d’Internet Archive. Pour Google c’est (une fois de plus) plus compliqué. D’abord parce que Google n’a jamais demandé l’autorisation à quiconque de conserver ou non une copie "cachée" de certaines pages. Ensuite parce qu’il n’a jamais indiqué (à ma connaissance) la durée pendant laquelle certaines copies sont conservées, et selon quels critères (si tant est qu’il y en ait) se faisait la sélection. Droit à l’oubli donc.
Or voici qu’une décision de justice américaine vient de décréter que le "Google cache" s’inscrivait dans une logique de "Fair Use" (usage équitable) et n’était donc pas condamnable, renvoyant le plaignant et derrière lui l’ensemble des usagers d’internet à leurs responsabilités, c’est à dire le droit (le devoir ?) de mettre en place une balise <Meta> ou un ficher Robots.txt si ils ne souhaitent pas voir leur site indexé et archivé. Cette procédure relève d’une politique d’Opt-Out. Traduisez : Google numérise et indexe tout, si vous ne voulez pas en être, c’est à vous de le dire (à google). L’alternative (compliquée et relativement impraticable pour les usagers autant que pour les moteurs) serait une politique d’Opt-In : si je veux être dans leur index, je dois leur demander.
"Opit-in", "Opt-out", Fair-use" … cela ne vous rappelle rien ?? C’est actuellement tout le débat (et les procès) qui oppose les éditeurs américains (et depuis peu, Français …) au projet Google Books (pour plus de détails voir le ppt disponible dans ce billet). Et cela pourrait, in fine, balayer d’un revers de la main tout l’argumentaire des éditeurs (qui eux aussi réclament un droit d’Opt-In).
Deux conclusions (bien provisoires) à ce billet :
- pour ce qui est de la question de la gestion et de la diffusion des contenus numériques "protégés" (copyright), l’économie de contenus numériques n’a pas fini de se transformer, et ses acteurs (bibliothèques, éditeurs, libraires, auteurs) n’en sont qu’au début de leurs légitimes craintes et interrogations.
- pour ce qui est du "patrimoine du temporaire" et du droit à l’oubli individuel, il est (à mon avis) plus que temps que des initiatives telles celle de ce sénateur américain se mettent en place : "I will be introducing a bill to prohibit the storage of personally information in Internet data bases beyond a reasonable period of time." Restera alors à définir ce délai "raisonnable" et à faire accepter cette charte déontologique aux acteurs/moteurs, ce qui là encore, ne sera pas une mince affaire. Mais si le monde change sur certains points, il doit pouvoir changer sur d’autres …
(Complément via EFF : un remarquable document de 16 pages qui dresse une revue complète des arguments des uns et des autres dans l’affaire Google Books)
(Source : EFF)