Le pagerank originel

La mémoire du web est infinie et ses voies très pénétrables. De la même manière qu’il est assez facile de trouver des photos de l’un des hommes les plus riches de la planète déguisé en femme, il est aussi facile de dénicher l’équation originelle du célèbre PageRank, via un tout simple powerpoint utilisé à l’époque par un certain Sergey Brin. La découverte est due à Paul Montgomery et est visible notamment par ici. Ne vous y trompez pas, il s’agit bien de l’équation originelle (à l’époque où Sergey et son copain Larry bricolaient sur à peine quelques millions – 25 – de pages). La PageRank actuel a évolué même si la "philosophie" reste la même. Pour ceux qui veulent vraiment approfondir la question, Greyhat avait déniché un excellent article (.pdf) très fouillé (33 pages) et précis sur l’algorithmie mathématique sous-jacente. C’est en le relisant en tentant de le déchiffrer que j’ai vraiment regretté d’avoir arrêté les maths en troisième suite à un conflit personnel avec le barycentre.
P.S. : plusieurs remarques anecdotiques suite au visionnage de l’intégralité de ce powerpoint :

  • ils ont bien fait de changer le logo. Les deux yeux au milieu faisaient un peu big brother …
  • la deuxième diapo (qui est une diapo de titre) est sous-titrée : "Loi de Moore, systèmes de fichiers, publicité et vie de tous les jours" … Et oui, déjà la publicité au centre de l’algorithmie.
  • une référence limpide à Garfield et à la bibliométrie sur la diapo 7
  • pensez à soigner le texte de vos liens car ils annotent les pages vers lesquelles ils pointent.
  • en 1998, ce garçon avait déjà tout compris (diapo 22) : "Advertising interests drive web search industry." (sic donc)
  • étonnant : Larry Page ne figure même pas sur la page de remerciements (dernière diapo)
  • décidemment instructif ce powerpoint 🙂

4 commentaires pour “Le pagerank originel

  1. Concernant votre avant-dernière remarque anecdotique portant sur l’absence de Larry Page dans les remerciements, je pense que cela s’explique assez simplement. Effectivement, sur chaque slide de la présentation, on peut voir (assez mal, j’en convient), l’adresse mail de Page. J’en conclu que c’est une présentation personnelle, et donc, il est assez inopportun de se remercier soi-même ;-))
    Je me souviens d’avoir utilisé ce slide quand j’ai rédigé mon mémoire portant sur les algorithmes employés par les moteurs de recherche. Cela me donne envie de retourner dans la bibliographie de ce travail !

  2. Manu> Merci. Effectivement ceci explique cela.
    A titre personnel je serai volontiers preneur de plus d’infos sur votre mémoire, voire du mémoire lui-même si vous en avez une copie numérique (olivier.ertzscheid@gmail.com). D’avance merci 🙂

  3. Pour les infos à propos de mon mémoire, il a été réalisé dans le cadre de mes études en Sciences de l’Information et de la Documentation à l’Université Libre de Bruxelles. Pour une copie électronique de celui-ci, je vous la fournirai bien volontier (malgré les nombreuses imperfections du document en question). Je vais essayer de remettre la main sur la version PDF, ou dans le pire des cas sur les sources LaTeX, pour cette soirée.

Répondre à olivier Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut