Au commencement étaient les folksonomies. Il y a encore peu de temps, en gros depuis 2005 et malgré le scepticisme intial à leur encontre, les folksonomies (indexation collaborative) étaient partout présentes sur le web. Leur âge d'or culminant entre 2006 et 2008. La plupart des outils d'accès, de YouTube à Dailymotion en passant par Delicious ou FlickR leurs réservaient une place centrale comme mode d'accès à l'information.
(Diapositive extraite de ma présentation au congrès de l'ABF en 2007, "Indexation sociale et bibliothéconomie de masse." Voir notamment les diapos 11 à 29)
Elles ont aujourd'hui presqu'entièrement disparu ou n'occupent plus qu'une portion congrue des modes d'accès et de recherche d'information. Tout au plus peut-on observer la survivance – pour le coup très vivace – de ces folksonomies au travers des hashtags sur Twitter, une survivance qui se cantone à un seul biotope documentaire quand la promesse initiale des folksonomies était de s'étendre, par contamination, à l'ensemble de l'écosystème du web.
L'indexation collaborative avait pourtant fait la preuve de son efficience comme supplétif aux processus d'indexation normés ; à la condition qu'elle franchisse un certain effet de seuil, elle permettait de compléter et parfois même de rejoindre ou de remplacer – sur certains fonds documentaires spécifiques – les attendus d'une indexation "classique". De mon point de vue, et pour ce qui est du domaine de la recherche d'information, les folksonomies venaient utilement suppléer un manque du mot caractéristique du flou cognitif qui préside à l'essentiel des scenarios de recherche d'information (c'est à dire à l'absence de besoin formalisé dans l'esprit du requêtant) ; en présentant des mots en excès au lieu d'une zone de recherche en défaut de mots, les folksonomies permettaient de palier l'absence de besoin documentaire formalisé, elles jouaient le rôle d'un irremplaçable dispositif d'amorçage cognitif ou de navigation par rebond (phénomène de sérendipité).
Un amorçage reposant sur l'étalement et le déploiement de signifiants, eux-mêmes déclencheurs de la construction d'une recherche de signifiés.
Sur toutes ces questions, on pourra notamment relire l'article "Etude exploratoire des pratiques d'indexation sociale comme une renégociation des espaces documentaires. Vers un nouveau big bang documentaire ?" disponible sur ArchiveSic.
Puis vinrent les boutons. "Like" par ici, "+1" par là, "Retweet" à gauche, "Recommend" et autres "Share on …" à droite, l'essentiel de nos interactions documentaires en ligne se résume à une activité de pousse-bouton (et vous savez tout le mal que je pense du web pousse-bouton). Nous ne qualifions plus des contenus, nous les partageons. Une accélération qui est une altération du temps de transmission (mais aussi de persistance) des documents et qui peut parfois jouer un rôle déterminant (y compris dans le domaine politique et/ou social, cf le récent printemps arabe), mais qui ôte aussi la promesse dont étaient porteuses les folksonomies : celle de faire de chacun d'entre nous un archiviste d'une mémoire collective en construction et en réagencement permanent.
Lazyweb. Il existe pourtant un point commun essentiel reliant boutons et indexation collaborative : c'est leur faible coût cognitif.
"« le marquage ("tagging") élimine la phase de décision (choisir la bonne catégorie) et dissipe la phase de paralysie d'analyse ("the analysis-paralysis stage") pour la plupart des gens. (…) Il offre un retour social et sur soi-même immédiat. Chaque "tag" traduit un peu de vos centres d'intérêts et les ancrent dans un contexte social immédiat. La beauté du marquage ("tagging") est qu'il est inscrit dans un processus cognitif déjà existant sans lui ajouter de coût cognitif supplémentaire. » Sinha R., « A cognitive analysis of tagging. », citée dans Ertzscheid O. et Gallezot G., "Etude exploratoire des pratiques d'indexation sociale comme une renégociation des espaces documentaires. Vers un nouveau big bang documentaire ?"
Capitalisme linguistique et libéralisme cognitif. Mais. Mais là où les folksonomies favorisaient un partage entre pairs, une thesaurisation intra-communautaire ouverte sur l'extérieur, là où les folksonomies créaient une valeur / valorisation documentaire partageable par tous et accessible à chacun, les boutons improprement désignés comme boutons "de partage" laissent toute la valorisation, toute la thésaurisation à la seule discrétion des sites hôtes (Google pour le +1, Facebook pour le Like, etc.). Ce partage là n'en est pas un. Ce partage là est l'avatar d'un capitalisme linguistique, d'un libéralisme cognitif qui vise à mettre à disposition de quelques-uns l'usufruit du labeur documentaire de chacun d'entre nous (oui c'est une thèse marxiste, et alors ? :-).
Nous n'en sommes encore pourtant qu'au degré zéro du bouton. Techcrunch, souvent bien informé, annonce que Facebook pourrait prochainement lancer une nouvelle série de boutons : "Read", "Listened", "Watched", et "Want". "Lu" ou "à lire", "écouté" ou "à écouter", "Vu" ou "à voir". Et "Désiré" ou "Obtenu" selon que l'on se place dans l'optique de l'internaute activant ces boutons dans une logique orientée-tâche, ou dans l'optique du site collecteur qui disposera ainsi d'une vue encore plus fine de nos comportements connectés. Là encore le lien avec les raisons du succès de feu les folksonomies est éclairant. En sus de leur faible coût cognitif, les folksonomies fonctionnèrent parce qu'elles permirent de mettre en place ce dont l'indexation classique n'arrivait pas à rendre compte : une indexation orientée-tâche, qui permette d'apposer sur des contenus, sur n'importe quel type de contenus, non pas simplement des marqueurs sémantiques descriptifs mais des stratégies contextuelles et performatives (comme le montrèrent nombre d'étude dont j'ai ce soir la flemme de retrouver les références, plus d'un tiers des mots-clés utilisés dans une approche d'indexation collaborative étaient des verbes d'actions : "à lire", "à consulter", "à imprimer", etc …).
La guerre des boutons.
Premier enseignement : l'indexation semble donc effectivement – et malheureusement – soluble dans les boutons. Deuxième enseignement : l'engouement actuel pour les boutons peut-être expliqué par au moins deux des raisons déjà à l'origine du succès des folksonomies (voir notamment la diapo 25 d'une de mes interventions à la BPI) : leur faible coût cognitif et leur aspect "orienté-tâche".
Troisième enseignement : les folksonomies reposent sur une base marxiste (elles postulent un phénomène d'auto-régulation au sein de la communauté qui les promeut et les utilise, un partage de la valeur ainsi créée) ; à l'inverse, les boutons jouent au maximum sur une dérégulation de la fonction du clic, ils tendent à la rendre la plus triviale possible, à faire baisser le cours de sa valeur d'échange pour pouvoir en tirer une valorisation maximale. Pour le dire autrement, ce n'est plus ni le producteur de contenu ni le consommateur qui touchent les dividendes de leur travail (travail de production pour le premier, travail de signalement et de re-production pour le second) mais c'est l'intermédiaire qui se sucre sur leur dos. Si je ne craignais de sombrer dans l'analogie vasouillarde, je pourrai aisément filer la métaphore de cette question des marges documentaires bénéficiaires à l'aide d'une analogie avec les enseignes de la grande distribution ; avec Facebook ou Google ou Amazon ou Apple jouant le rôle du supermarché, les internautes producteurs de contenus (blogueurs notamment) dans celui des exploitant agricoles spoliés de leurs marges, et les consommateurs que nous sommes enchaînés à leur caddy (souvenez-vous du Kindle-caddy, de la boutique et du bazar).
Quatrième enseignement, cette guerre des boutons est évidemment d'abord une guerre des données.
(diapositive – n°39 – extraite de ma présentation sur les données personnelles à l'école d'été en architecture de l'information)
Transformer la recommandation en prédiction. La pierre philosophale du web. Si la multiplication des boutons se confirme et avec elle l'avènement d'un web presse-bouton, les quelques firmes qui survivront dans cet écosystème pourront alors envisager, tels de nouveaux alchimistes, de transformer le plomb en or. De transformer des ingénieries de la recommandation en technologies de la prédiction.
De faire de chacune de leurs "suggestions" une sujétion de nos désirs.
C'est déjà une chose connue et largement analysée que celle d'une économie de l'attention elle-même dépendante de l'amplification sans cesse croissante et de la captation sans cesse plus fine du spectre relationnel et de l'étendue sociale de nos recommandations. Aujourd'hui est déjà atteint ce qui semblait encore hier être le rêve un peu fou de quelques doux dingues de l'algorithmie : celui d'un web implicite, celui de moteurs de divination capables, en travaillant sur leur inépuisable base de donnée des intentions, d'apporter des réponses avant même que ne soient posées les questions.
Mais si la suggestion reposant sur une analyse tendancielle peut se prévaloir d'un fondement – et d'une réalité – mathématique et statistique, la prédiction disposant d'un niveau de fiabilité garanti demeure, en l'état actuel des connaissances, une pure construction de l'esprit. La réalité est heureusement plus complexe que les modèles mathématiques, informatiques ou physiques qui en rendent pourtant objectivement compte.
Pourtant, au cours de la rédaction de ce billet, plusieurs signaux viennent confirmer cette tendance autour de laquelle, demain peut-être, s'organiseront nos modes d'accès à l'information. Ici un nouveau moteur, Recorded Future, mélangeant modèles prédictifs, analyse comportemantale et ingénierie linguistique. Là une police prédictive se reposant sur la capacité d'un algorithme à prédire les prochaines scènes de crime. Ici encore, un programme capable de prédire le printemps arabe comme les fluctuations de la bourse.
Et partout, partout, la même antienne, celle de prédire l'avenir en décodant le présent numérique. Une ambition qui n'est pas une erreur factuelle, mais qui est une faute interprétative.
Big Data et grandes questions. Il faut ici lire et relire attentivement le dernier article de Danah Boyd et Kate Crawford, "Six provocations for Big Data", pour mesurer les enjeux et les problèmes liés aux règne des Big Data :
- "Automating Research Changes the Definition of Knowledge.
- Claims to Objectivity and Accuracy are Misleading
- Bigger Data are Not Always Better Data
- Not All Data Are Equivalent
- Just Because it is Accessible Doesn’t Make it Ethical
- Limited Access to Big Data Creates New Digital Divides"
Sur ce dernier point (les nouvelles fractures numériques), Danah Boyd et Kate Crawford rappellent :
"But who gets access? For what purposes? In what contexts? And with what constraints? While the explosion of research using data sets from social media sources would suggest that access is straightforward, it is anything but. As Lev Manovich (2011) points out, ‘only social media companies have access to really large social data – especially transactional data. An anthropologist working for Facebook or a sociologist working for Google will have access to data that the rest of the scholarly community will not.’"
Et de conclure en citant Derrida :
« La démocratie effective se mesure toujours à ce critère essentiel : la participation et l’accès à l’archive, à sa constitution et à son interprétation. »
L'après diction. La prédiction, le modèle prédictif que nous annoncent et nous proposent les firmes des Big Data est pour l'instant une simple pré-diction, la présentation de ce que nous aurions pu dire doublée d'une incitation à le dire, à dire ce que les autres nous font dire, d'une injonction faite aux autres de le considérer comme ayant été dit. Cette pré-diction est également une privation. Une privation de la parole possiblement inscrite, la privatisation de l'accès à une mémoire collective, qui ne nous laisse comme horizon que celui d'une "après diction", le choix binaire de consommer ou non, le choix binaire de se souvenir en dedans du système ou d'être oublié en dehors de lui, le hold-up documentaire de l'archive. Reste que, comme le disait encore récemment Bernard Stiegler :
"Reste que la démocratie est toujours liée à un processus de publication – c’est à dire de rendu public – qui rend possible un espace public : alphabet, imprimerie, audiovisuel, numérique."
Laisse aller, c'est une valse. L'acte du publication comme participation à l'indexation du monde. L'archive, la publication, l'indexation. Une valse à trois temps. La recommandation, la prescription, la prédiction. Une valse à mille temps. "Trois cent trente trois fois le temps de bâtir un roman" comme disait l'autre. Un roman d'anticipation qui repose sur une illusion fondamentale dont Jean-Michel Salaün fournit l'une des clés essentielles :
"(…) la multiplication des documents et des genres dans toutes sortes de registres et leur transformation témoignent d’une relation fiévreuse à notre passé, une sorte d’interrogation existentielle sur notre présent face à un futur angoissant dont les termes se renouvellent sous nos yeux."
Et de poursuivre :
"Mieux ou pire, le numérique par ses capacités calculatoires permet de reconstruire des documents à la demande et nous donne l'illusion d'avoir toutes les réponses à nos questions avant même qu'elles ne soient posées, comme si notre futur était un destin déjà inscrit dans les machines."
Les folksonomies n’ont pas disparus de tous les sites sociaux : j’aurais plutôt tendance à dire que c’est la stratégie économique de certains sites sociaux qui les poussent à l’extérieur. Les sites sociaux documentaires (Wikipédia, LibraryThing…) ont plutôt tendance à les exploiter. Mais ce n’est pas l’objectif de YouTube, Google+ et autres Facebook.
D’accord sur le fait qu’elles pallient une absence, bien souvent… Mais il faut aussi souligner qu’elles ont montré leurs limites : le marquage de milliers de documents sous un même tag, n’apporte aussi qu’une catégorisation bien limitée. (« Toutes les BD sont des BD, ok. Et puis ?… »)
J’ai un peu l’impression que cette nouvelle économie du bouton n’est pas si neuve : les bataillons de boutons fleurent bon le bon temps du web 2.0 : http://www.internetactu.net/2006/10/27/web-20-centre-sur-lutilisateur-vraiment/
Les boutons en question ont d’ailleurs toujours le même objectif : favoriser l’interaction. Une page Facebook désormais n’est faite que de boutons pour susciter la réaction : tout semble se refermer sur nous comme une prison de l’attention, dont l’objectif est de garder l’internaute captif, même sur les services déportés. Bien sûr, les intermédiaires engrangent les dividendes de ce jeu sur les boutons, mais malgré tout, les utilisateurs ne sont pas aussi lésés qu’il y paraît. Ils échangent (cliquent, réagissent, commentent…) certainement plus que jamais. Bien sûr, c’est une guerre des données, une guerre des services, une guerre pour le contrôle de l’écosystème… mais c’est aussi une guerre autour de la capture de l’attention. Le rejet par Google+ de tout ce qui n’a pas un nom normal, le rejet par Facebook (et Google+) du RSS pour obliger les impétrants à être des utilisateurs actifs… me semble également éclairant.
Ce qui est amusant dans cette pré-dition que tu décris, c’est qu’on voit bien, qu’à terme, ce système pourrait tourner tout seul. Facebook ou Google+ pourraient tout à fait alimenter mon compte sans moi finalement. Et c’est peut-être par là qu’ils vont devenir finalement beaucoup moins amusants…
On intellectualise parfois pour pas grand-chose… Les boutons J’aime de Facebook et de Google n’ont manifestement qu’un seul but : inviter ceux qui lisent une page Web à s’inscrire à leur service ou à y retourner si d’aventure ils ne s’étaient pas connectés récemment. En somme, il s’agit d’une monétarisation de plus, ce qui venant de systèmes par essence marchands n’étonnera personne.
Arthur> il se trouve que je suis (grassement) payé pour intellectualiser 🙂 Une lecture plus attentive de mon billet vous indiquera que drainer des abonnés n’est pas, loin s’en faut, le seul but des divers boutons.
Hubert> tu as raison sur ton premier point : ce n’est pas un hasard (c’est en tout cas le sens de mon billet) si seuls les sites explicitement documentaires continuent de les exploiter.
Pas d’accord avec toi en revanche sur les limites. Les problèmes de polysémie, de tags récurrents existent évidemment mais toutes les études montrent qu’ils ne sont que le terreau sur lequel émergent et se distinguent les qualificatifs pertinents pour les usagers. Pour le dire autrement, « en entrée » du système, on est parfois noyé ou perdu dans des tags non discriminants. Mais à l’usage (= en sortie), et après une phase d’acclimatation (qui serait une perte de temps pour Google et les autres) les folksonomies remplissent leur but : la complémentarité ou le remplacement d’une indexation normée.
Merci pour ta conclusion qui synthétise parfaitement ce à quoi je pensais en écrivant ce billet.
Du moment qu’on appuie pas sur le fameux bouton et qu’EDF n’est pas en panne je ne me soucie de rien !
@Olivier. Je ne disais pas que *tout* votre travail ne sert qu’à justifier votre salaire, sans autre utilité. Mais pour cet article : manifestement, c’est le cas.
Pour ce qui est d’être « grassement payé », je vous trouve quand même un peu indécent : sans vouloir vous comparer à 50 % des salariés de ce pays (la médiane, c’est 1 350 euros par mois, j’espère que vous gagnez plus), sans parler des sans-emplois, avez-vous seulement idée de ce que gagnent les précaires qui vous entourent à l’université ?
Et pour revenir au fond de votre article : non, vous ne traitez pas des raisons d’être de tous ces boutons, vous imaginez seulement de possibles conséquences. C’est renverser le raisonnement en vous faisant _deus ex machina_ qui sonde les cœurs et les reins et c’est évidemment une grave faiblesse.
Pour comprendre un mécanisme économique, idéologique ou social, il suffit souvent d’être radical, c’est-à-dire de prendre les choses par leur racine. Et pour une compagnie qui cherche à augmenter son profit, la racine de toute chose, c’est le profit.
Quant à analyser les effets, il convient tout de même d’attendre un peu, de prendre du recul, d’interroger l’ensemble des acteurs et de garder un peu de neutralité axiologique. (Mais j’entends déjà votre objection : et mes indispensables publications ? :-))
Arthur> je crois que vous vous trompez de client. Primo, je ne suis pas « payé » pour ce que je fais sur ce blog. Je le fais « en plus » de ce pour quoi je suis payé (faire des cours, de la recherche et de – plus en plus – l’administratif).
Deuxio, oui, j’ai une idée très exacte de ce que touchent les précaires qui m’entourent. Et je me bagarre, à mon niveau, contre la précarité à l’université (et ailleurs). Tertio je ne sonde ni les coeurs ni les reins, je produis des analyses, je fabrique des concepts, « j’intellectualise » si cela vous chante. D’autre part, on peut aussi effectivement attendre avant d’analyser les effets d’un phénomène qui concerne tout de même plus de 700 millions de personnes dans le monde depuis déjà 5 ans, mais je ne crois pas que ce soit le bon choix. Enfin, je réserve la neutralité axiologique (bigre …) à mes publications académiques. La consultation de ce site : http://archivesic.ccsd.cnrs.fr/ vous en apportera la preuve. Je conçois précisément cette activité non-rémunérée qu’est le blog de chercheur comme un espace de radicalité axiologique 🙂
Bonjour,
J’observe les usages informationnels sur Twitter depuis quelques temps (moi aussi on me paye pour « intellectualiser »).
L’utilisation des boutons (retweets, envoi depuis un site, etc.) voir même les systèmes de « feed » sont de plus en plus monnaie courante (comparativement à il y a encore un an).
D’un point de vue purement d’analyse, cette multiplication de (micro)documents similaires n’apportent pas grand chose…
D’un point de vue de l’indexation il semble cependant que cette automatisation apporte une plus grande homogénéité dans sa diffusion fragmentée et réticulaire, et vise à répondre à un facteur (économique ?) essentiel : l’accroissement de contenus.
Je ne suis donc pas tout à fait d’accord sur le fait que le bouton amène une dérégulation, là ou au contraire il permet la production d’une valeur essentielle au web : le signe. L’indication vers un contenu dont la réarticulation sémiotique à moins d’importance in fine, que l’identité qui l’a signalé. Bref, le bouton vise à apporter du sens par le « cliqueur » (qui clique, dans quelle communauté, etc.) et son homogénéisation, plutôt que par le travail d’indexation.
D’accord cependant avec vous sur les probables risques à long termes. Le tout étant de ne pas tomber « dans un fétichisme de la data » et proposer des alternatives viables…
@Arthur : « Le réel n’est jamais ce que l’on pourrait croire, il est toujours ce qu’on aurait dû penser » (Bachelard)… Mais bon, peut-être des fois ne vaut-il mieux pas penser ?!…
Merci pour cet article très intéressant.
Une fois avec notre réseau (d’amis, de contacts) sur un réseau, on a envie de tout y injecter, pour échanger. Le risque est qu’on ne commente plus du tout l’information, on envoie un lien brut, une vidéo, sans l’ajout de méta-information que représentent les tags.
Olivier, je vois que vous êtes piqué au vif… Aurais-je touché juste ?
En ce qui concerne votre (excellent) blog, il s’agit d’un jeu gagnant-gagnant : vous apportez beaucoup à vos lecteurs (dont moi) et en échange vous gagnez en surface de notoriété. Mais ne me dites pas que tout ça n’a rien à voir avec votre carrière, ce serait drôlement hypocrite.
Pour le reste, au milieu de beaucoup d’analyses très intéressantes, il vous arrive d’en produire de plus faibles, voire d’extrêmement faibles (mais qui vous permettent, vous le dites vous-même, de justifier votre salaire).
Cette note faisait partie des « extrêmement faibles », si manifestement destinées à justifier votre situation… Je n’ai voulu que le regretter : vous êtes capable de mieux.
@Ellimac. « Mais bon, peut-être des fois ne vaut-il mieux pas penser ?!… » Puis-je me permettre de vous informer que vous êtes une andouille gonflée de suffisance outrée ? Car vous l’êtes, hélas…