Outillage wikipédien (suite) : le détecteur de réputation

L’outillage wikipédien décrit dans ce billet vient de s’étoffer un peu plus, ainsi que la problématique déjà très riche de la redocumentarisation. Explications : dans la lignée du détecteur de TRDs (Wikiscanner), permettant de repérer les adresses IP (et conséquemment les personnes et/ou organismes) des contributeurs les plus fâcheux, une équipe de chercheurs a mis au point un détecteur de réputation, un outil qui colore en orange les contributions ou les aspects d’un article "les plus suspects", lequel repérage desdits aspects considère que plus les écrits d’un wikipédiste sont rapidement modifiés/corrigés/effacés, et plus ledit wikipédiste est suspect. Ce qui est en jeu derrière cet outil, c’est donc le repérage d’un "indice de confiance" (trust) rattaché à chaque contributeur, et reposant :

  • non pas sur les qualités propres du contributeur (auquel cas on reviendrait au fonctionnement d’une encyclopédie "classique" mandatant des experts pour sa rédaction)
  • non pas sur la qualité intrinsèque de la contribution (précisément non-mesurable)
  • mais sur la temporalité qui sépare une modification, une édition d’article, de sa relecture, de sa réédition. Ce que les auteurs à l’origine de cet outil appellent un "content-driven reputation" : "les auteurs dont les contributions sont préservées ou étayées par d’autres, gagnent de la réputation."

En d’autres termes, l’indice de confiance (IC) d’un contributeur (a) équivaut à la distance temporelle séparant deux ou plusieurs redocumentarisations d’un même article. Plus cet intervalle de temps est élevé, plus le contributeur est considéré comme fiable.
Pour que cela marche, il faut se reposer sur le fonctionnement et la temporalité complexe de wikipédia, qui veut que l’ensemble des contributeurs se répartissent les rôles à la manière de l’organisation d’une fourmilière, certains traquant plutôt les fautes d’orthographe, d’autres les adresses IP, d’autres – les wikipompiers – se chargeant des guerres d’édition.
Ce qui est intéressant dans cet indice de confiance, c’est qu’il ne repose pas sur la qualité intrinsèque de ce qui est écrit (laquelle est statistiquement ou algorithmiquement invérifiable), mais sur l’interrogation de la densité de la dimension palimpsestique de wikipédia. Je m’explique : plus une écriture est vite recouverte par une autre, et moins elle est fiable. En d’autres termes encore, une non-expertise chasse l’autre, et au final (le ratio d’utilisateurs/nombre de modifications étant statistiquement parlant) l’indice de confiance mesuré semble donner des résultats probants. Cette idée d’un palimpseste vient poursuivre la réflexion que j’avais (brièvement) engagée autour de la notion de souscription et que je vous resitue brièvement (pour la version longue, voir ce billet) :

  • "Sur le web, et particulièrement dans le web dit "2.0", le contenu s’efface derrière l’architecture. Le discours n’est plus
    ancré dans un dispositif (technologique) mais le dispositif ancre le
    discours. Il n’est plus "au service" mais "à l’origine" du discours. Il
    en devient la condition. (…) les développements du (web 2.0 + Social software +
    RSS) nous emmèneraient vers un "troisième âge" de la navigation : après
    le browsing et le searching voici venu le temps du "subscribing". On ne
    navigue plus, on ne recherche plus, on s’abonne, on "souscrit". Notons
    d’ailleurs que l’étymologie de ce dernier vocable est intéressante :
    "souscrire", "sub-scribere", littéralement "écrire en dessous", à moins
    qu’il ne s’agisse d’écriture "sous autorité" : en agrégeant les
    discours écrits ou postés par d’autres, on est, de facto, placé "sous"
    une "autorité" qui n’est plus notre."

Ainsi, ce qui fait qu’un auteur/contributeur wikipédiste "fait autorité", c’est sa capacité à résister à la chute palimpsestique, la capacité de ses écrits à demeurer littéralement "au-dessus" des autres.

Bref, une intéressante plongée dans les arcanes de l’autoritativité ("attitude consistant à produire et à rendre public des textes, à s’auto-éditer ou à publier sur le WWW, sans passer par l’assentiment d’institutions de référence référées à l’ordre imprimé"), qui permettra peut-être à terme de distinguer entre auteur et contributeur et de s’affranchir de la notion d’expertise, ou tout du moins de se satisfaire d’une expertise numérique héritière des propriétés de son support (mobile, ouverte, en reconfiguration permanence, cinétique).
Cette approche me rappelle un peu – mais dans un autre genre – celle de la pertinence pour les moteurs de recherche : après n’avoir eu pendant longtemps (je schématise à outrance, pardon aux initiés qui me lisent) que le nombre d’occurence du mot-clé pour mesurer la pertinence d’une page, Google arrive et explique que ce n’est pas le contenu qui fait la pertinence mais le repérage par d’autres (plus une page est liée, plus elle est pertinente).

Au final, cet outil et l’approche qu’il met en place devrait réconcilier les anciens et les modernes qui aiment à se quereller autour des notions d’auteur et d’autorité. Ce qui fait un auteur, classique ou contemporain, c’est la capacité intrinsèque de son écriture à résister à l’épreuve du temps, à se fixer, à se stabiliser, à aller à l’encontre de dynamiques parfois paradoxales, in fine à l’emporter – tout au moins stylistiquement  – sur d’autres (ex : d’autres que Flaubert on écrit des histoires de la petite bourgeoisie provinciale, mais personne d’autre que lui n’a écrit Madame Bovary). Sur le chemin qui lui permettra demain de circonscrire son autorité (et ce faisant celle de ses auteurs) Wikipédia pourrait bientôt faire ainsi un pas décisif, un pas qui l’aidera et aura pour premier effet, selon un cercle vertueux, de mieux circonscrire également son périmètre documentaire et les redocumentarisations ainsi "autorisées".

A signaler : cette recherche peut être rapprochée d’une lignée de travaux qui ont démontré que la "qualité" des articles de Wikipédia dépendait à la fois du nombre de modifications et du nombre de  contributeurs distincts. "Plus un article est modifié par "n" contributeurs différents meilleur il est", ou pour le dire autrement et de manière plus juste, "moins un article est modifié par un grand nombre de contributeurs, meilleur il est", ce qui là encore est une retranscription fidèle de la chaîne d’expertise telle que la révèle par exemple le processus de revue par les pairs : moins un article scientifique soumis est modifié par ses relecteurs experts, plus il a de chances d’être publié, et meilleure est sa qualité scientifique intrinsèque. Ces études ne sont d’ailleurs qu’en contradiction apparente : la dimension palimpsestique est bien présente, mais c’est la capacité d’une édition/modification à être stabilisée sans être à son tour modifiée par un grand nombre de contributeurs distincts, qui détermine la qualité d’un contributeur, et ce faisant des articles/éditions qu’il produit.

A signaler également : l’article (scientifique) à l’origine de ce prototype de détecteur de réputation : 

  • B.T. Adler, L. de Alfaro.
    A Content-Driven Reputation System for the
    Wikipedia.

    In WWW 2007, Proceedings of the 16th International World Wide Web
    Conference,
    ACM Press, 2007 (.pdf)

Autorité – Réputation – Expertise : le triangle des bermudes de la qualification de l’information. On n’a pas fini d’en (re)parler …

(Via : Hubert en commentaire, qui le tenait d’OutilsFroids qui l’avait lu dans Wired)

3 commentaires pour “Outillage wikipédien (suite) : le détecteur de réputation

  1. Très intéressantes pistes de réflexion, merci Olivier pour toutes ces ouvertures qui alimentent le concept d’autorité informationnelle que j’avais tenté d’ébaucher un moment et que je développerai… sur un blog collectif ! à venir…
    Evelyne

  2. Wikipédia : les outils de la confiance

    Alors que Wikipédia na cessé de croître en volume (lencyclopédie vient de fêter son 2 millionième article dans la version anglaise, 555 000 dans la version française) comme en réputation depuis son lancement en 2001, linformation q…

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut