J'ai eu le plaisir d'être interrogé à l'occasion de la parution du troisième cahier "Innovation et perspective" de la CNIL. "Lire, regarder, écouter et jouer en ligne à l'heure de la recommandation." Le cahier entier est passionnant (comme les 2 numéros précédents, celui sur "le corps connecté" – en pdf – et celui sur "la vie privée en 2020" – en pdf aussi ) et j'en extrais donc ladite interview pour archivage personnel.
—————
Du point de vue de la diversité culturelle, la recommandation est-elle vraiment un danger ?
La question clé de la recommandation, qu’il s’agisse de contenus culturels ou d’opinions politiques ou religieuses exprimées pas nos amis sur les réseaux sociaux, est celle de la bulle de filtre d’Eli Pariser : les algorithmes favorisent-ils la diversité ou au contraire les phénomènes d’homophilie, c’est à dire le renforcement de nos propres gouts, croyances, opinions et affinités ? Toutes les études scientifiques sur le sujet, depuis celle de Fleder et al. en 2007 (1) jusqu’à celle de Facebook en Mai 2015 montrent que 2 niveaux d’interprétation se superposent : on observe, à l’échelle de l'individu, une augmentation de la diversité des produits culturels et/ou opinions auxquels il est exposé ; mais cette diversité diminue dès que l’on passe à un niveau plus global. Il y a donc, au niveau micro, une augmentation de la diversité, et une diminution de cette même diversité au niveau macro.
Comment les systèmes de recommandation ont-ils évolué ?
Nous sommes sortis d’une simple recommandation statistique (basée sur l’historique de nos achats ou de nos consultations) pour aller vers des logiques de plus en plus fines mais aussi de plus en plus contraintes de prescription capables de s’affranchir de toute historicité pour mettre en place une approche multifactorielle. D’abord l’algorithmie a progressé et la simple analyse statistique intègre désormais une part de stochastique, d’aléatoire, qui permet au consommateur de ne pas voir défiler éternellement les mêmes catégories de produits. Ensuite nos comportements et nos usages se sont également diversifiés, à la fois du point de vue du matériel (smartphones, tablettes), du temps et de la vitesse de l’accès, mais aussi du point de vue des usages : plus nous consommons de contenus en ligne au travers par exemple d’offres d’abonnement ou de streaming et plus il est facile de qualifier ces comportements et de produire des recommandations plus fines. Enfin la collecte massive de données personnelles permet de faire varier le cycle et les logiques de prescription en fonction d’un nombre quasi-illimité de critères : heure de connexion, historique des sites visités, panier moyen d’un consommateur, goûts littéraires ou musicaux, composition du foyer (nombre d’enfants, âge, sexe, etc.),
Ces acteurs économiques sont donc de vrais industriels de la recommandation ?
C’est cette alliance de la quantification statistique et de la qualification documentaire qui fonde la puissance des industries de la recommandation. Le cycle de la prescription algorithmique, beaucoup plus renseigné, plus complet et plus paramétrable que celui de la prescription classique, fonctionne par percolation grâce aux régies publicitaires partagées : le produit que vous avez regardé sur le site de la FNAC hier s’affichera pendant une semaine en lien sponsorisé sur vos sessions Facebook, vous enverra des notifications sur votre smartphone, etc. Le problème est qu’il est pour ainsi dire impossible de reconstruire a posteriori ce process de prescription algorithmique : la prescription n’étant pas incarnée, le consommateur n’a en retour aucune possibilité de la recontextualiser et se contente trop souvent de la subir. La traçabilité fonctionne à sens unique.
(1) FLEDER, Daniel et HOSANAGAR, Kartik.
« Blockbuster Culture’s Next Rise or Fall : The impact of recommender systems on sales diversity », Management Science, septembre 2007. http://papers.ssrn.com/sol3/papers.cfm?abstract_id=955984