La mémoire du web est infinie et ses voies très pénétrables. De la même manière qu’il est assez facile de trouver des photos de l’un des hommes les plus riches de la planète déguisé en femme, il est aussi facile de dénicher l’équation originelle du célèbre PageRank, via un tout simple powerpoint utilisé à l’époque par un certain Sergey Brin. La découverte est due à Paul Montgomery et est visible notamment par ici. Ne vous y trompez pas, il s’agit bien de l’équation originelle (à l’époque où Sergey et son copain Larry bricolaient sur à peine quelques millions – 25 – de pages). La PageRank actuel a évolué même si la "philosophie" reste la même. Pour ceux qui veulent vraiment approfondir la question, Greyhat avait déniché un excellent article (.pdf) très fouillé (33 pages) et précis sur l’algorithmie mathématique sous-jacente. C’est en le relisant en tentant de le déchiffrer que j’ai vraiment regretté d’avoir arrêté les maths en troisième suite à un conflit personnel avec le barycentre.
P.S. : plusieurs remarques anecdotiques suite au visionnage de l’intégralité de ce powerpoint :
- ils ont bien fait de changer le logo. Les deux yeux au milieu faisaient un peu big brother …
- la deuxième diapo (qui est une diapo de titre) est sous-titrée : "Loi de Moore, systèmes de fichiers, publicité et vie de tous les jours" … Et oui, déjà la publicité au centre de l’algorithmie.
- une référence limpide à Garfield et à la bibliométrie sur la diapo 7
- pensez à soigner le texte de vos liens car ils annotent les pages vers lesquelles ils pointent.
- en 1998, ce garçon avait déjà tout compris (diapo 22) : "Advertising interests drive web search industry." (sic donc)
- étonnant : Larry Page ne figure même pas sur la page de remerciements (dernière diapo)
- décidemment instructif ce powerpoint 🙂
Bonjour,
Pour ma part je fais souvent référence à cette URL dans mes supports : http://www-db.stanford.edu/~backrub/google.html qui présente la même formule.
Merci pour le PDF sur le calcul actualisé du page rank.
Amitiés
Concernant votre avant-dernière remarque anecdotique portant sur l’absence de Larry Page dans les remerciements, je pense que cela s’explique assez simplement. Effectivement, sur chaque slide de la présentation, on peut voir (assez mal, j’en convient), l’adresse mail de Page. J’en conclu que c’est une présentation personnelle, et donc, il est assez inopportun de se remercier soi-même ;-))
Je me souviens d’avoir utilisé ce slide quand j’ai rédigé mon mémoire portant sur les algorithmes employés par les moteurs de recherche. Cela me donne envie de retourner dans la bibliographie de ce travail !
Manu> Merci. Effectivement ceci explique cela.
A titre personnel je serai volontiers preneur de plus d’infos sur votre mémoire, voire du mémoire lui-même si vous en avez une copie numérique (olivier.ertzscheid@gmail.com). D’avance merci 🙂
Pour les infos à propos de mon mémoire, il a été réalisé dans le cadre de mes études en Sciences de l’Information et de la Documentation à l’Université Libre de Bruxelles. Pour une copie électronique de celui-ci, je vous la fournirai bien volontier (malgré les nombreuses imperfections du document en question). Je vais essayer de remettre la main sur la version PDF, ou dans le pire des cas sur les sources LaTeX, pour cette soirée.