Données en conserve et date limite de péremption

La conservation des traces personnelles (laissées au hasard de nos navigations et de nos connections à divers services) par ces gigantesques silos de données que sont les moteurs de recherche (GYM en tête) pose depuis déjà longtemps quelques problèmes dont les plus flagrants sont celui du droit à l’oubli, et celui de la réutilisation de ces données à des fins de marketing comportemental (au mieux). Il s’agit là d’un enjeu majeur à prendre en compte dès aujourd’hui si l’on ne veut pas que l’actuelle "base de donnée des intentions" ne donne lieu demain à l’émergence d’un nouveau Big Brother. Stigmatiser le contrôle des sociétés qui sont à la fois fournisseurs de services, collecteurs de données et régies publicitaires (c’est à dire aux deux bouts de la chaîne) ne sert à rien puisque :

  • la tendance à la concentration sur ces secteurs ne s’inversera pas (ou en tout cas pas dans l’immédiat)
  • le service rendu à l’usager par les services offerts (d’ailleurs le plus souvent gratuit) est réel (et tant que l’usager bénéficiera d’un service gratuit (ou de très faible coût) de qualité, il continuera d’y adhérer sans trop se poser de questions)

Une autre voie pourrait être celle de la formation : expliquer qu’un identifiant de connection n’est ni anodin ni anonyme est certes une solution à long terme – notamment pour les jeunes générations ("digital natives"), mais là encore, il est tout à fait clair que l’immense majorité des internautes d’aujourd’hui (et de demain) passera à côté de ce effort (pour autant qu’il soit mis en oeuvre de manière un peu systématique).
Ne reste donc que deux voies :

  • celle du législateur qui monte au créneau
  • et celle de moteurs qui soucieux de ménager une image de marque déjà sévèrement entâchée, se prêtent au jeu du "fair use" des données personnelles.

Le législateur (européen) étant un peu sorti de sa léthargie en la matière, le dernier épisode en date dans cette bataille feuilletonnesque, est celui de Google qui fait un pas significatif … en arrière.
Mais résumons les faits : jusqu’ici Google conservait indéfiniment (si, si) toutes (si, si) les traces de connection et de navigation laissées sur le moteur et/ou ses sites/sociétés affilié(s)s. Il le faisait de manière autocentrée, refusant par ailleurs de céder à des pressions judiciaires lui enjoignant de communiquer certaines de ces données.
Il y a quelques jours, Google fait part d’un changement radical de position en indiquant qu‘il ne conservera plus ces traces qu’entre 18 et 24 mois. Ce délai, qui peut encore apparaître important, est lié à certaines règles juridiques qui imposent un délai de conservation suffisant pour permettre de remonter la chaîne jusqu’à des utilisateurs dans le cadre de litiges.
Il y a au moins 3 raisons à ce changement de politique de conservation des données chez Google.
Mais d’abord : c’est quoi une donnée personnelle ?? Et bien c’est ça (exemple tiré du billet de Danny Sullivan) :

Soit dans l’ordre d’apparition :

  • une adresse IP,
  • une date de connection,
  • les mots clés saisis,
  • le cookie unique qui vous est attribué par Google et permet de vous suivre à la trace même si l’IP de votre connection change (IP flottante ou changement de fournisseur d’accès).

Et maintenant voici les raisons du changement de politique de Google :

  • primo, un intense lobbying d’associations militant pour le "droit à l’oubli numérique" et, pour le moteur, le risque de voir son image se ternir
  • deuxio, une directive européenne fixant des règles de conservation de 6 à 24 mois
  • tertio, des raisons matèrielles qui font que le stockage des ces données, si on l’aligne avec l’immense capacité mémorielle qui est déjà celle de Google (usenet et forums de discussion, base de donnée "coeur" et ses probables 15 milliards de pages), et si on la croise avec les nouvelles ambitions conservatoires de la firme en matière de numérisation d’ouvrages (programme Google Books), raisons matérielles qui font donc que les capacités de stockage de sont pas infinies, même pour Google, et qu’elles lui coûtent déjà très très très très cher pour la maintenance et l’alimentation de ses pantagruéliques datacenters.

Ce qui fait qu’au final, au bout de 2 ans, vos données personnelles (cf l’exemple cité plus haut) ressemblerons à cela (en gras et en rouge la partie anonymisée) :

 

Tout cela pourrait donc être "pour le mieux dans le meilleur des mondes possible", mais notons pour conclure,

  • que comme le souligne Danny Sullivan, l’association de votre nom à votre trace de connection (si par exemple vous utilisez un service Google comme Gmail avec votre vrai nom), soit le seul moyen effectif de tracer nominativement un individu, cette association n’est en aucun cas stockée dans les fichiers logs que Google va anonymiser. Elle est stockée ailleurs. Et vu sous cet angle, le problème de la base de donnée des intentions reste donc entier …
  • que cette nouvelle virginité concernant les données personnelles ne règle pas l’épineuse question de la conservation en cache de certaines pages, qui peuvent par exemple contenir … des données personnelles …
  • qu’aux Etats-Unis (cf la mise à jour de l’incontournable billet de Danny Sullivan), les réactions sont plutôt mitigées, indiquant qu’il s’agit là au mieux d’un premier pas intéressant, et qu’en tout état de cause Google reste à ce jour le seul à pouvoir mener une opération de Datamining planétaire sur la serule base du croisement des adresses IP et des requêtes déposées.
  • que certains services (comme le search history) pourront, à la demande de l’internaute, autoriser une conservation plus longue. Notons ici qu’il s’agit d’un autre tournant historique puisque c’est la première fois que Google pratique l’opt-in ( = "on vous demande votre avis d’abord") au lieu de son habituel et si polémique Opt-out (= "on numérise/conserve tout, et on vous demande votre avis après")
  • et qu’en tout état de cause, il s’agit pour l’instant d’un effet d’annonce, la mise en place effective de cette anonymisation des données n’étant programmée que pour au mieux dans un an … et qu’en plus la "rétro-anonymisation" (= l’anonymisation effective de toutes les données personnelles effectivement collectées depuis 1998) risque de prendre un certain temps et de n’être pas l’une des priorités de la firme …

S’il s’agit donc incontestablement d’un pas dans la bonne direction, il serait encore très malvenu d’accorder un blanc-seing à l’organisation et de considérer la partie comme gagnée. Le risque d’incendie demeure. Mais l’on vient de placer quelques extincteurs dans l’entrepôt. Il était grand temps.

(Via Silicon.fr, Danny Sullivan, Zorgloob, Abondance, le billet officiel de Google)

Un commentaire pour “Données en conserve et date limite de péremption

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut