Vous souvenez-vous du débat télévisé entre Ségolène Royal et Nicolas Sarkozy ? Vous souvenez-vous, dans ce débat, de l’épisode sur l’EPR de 3ème génération ? Vous souvenez-vous de la TRD (tentative de redocumentarisation déviante) occasionnée ? Oui ? (sinon, allez vous rafraîchir la mémoire ici, puis revenez).
L’autre soir, dans un autre pays, un autre débat opposait Sarah Palin à Joe Biden. Et que font aujourd’hui les gens (enfin certains) pendant les débats politiques ? Et bien ils cherchent. Ils cherchent à comprendre. En France ils avaient donc cherché sur Wikipédia la vérité sur l’EPR, et comme les partisans de l’un y trouvèrent la vérité, mais que cette vérité était celle de l’autre, ils se mirent à chacun écrire leurs vérités. Sans dommage heureusement. Aux Etats-Unis, les gens ont cherché … mais sur Google. Et Google s’est "amusé" avec son outil Google Trends, pour "voir" littéralement ce que les gens tapaient … dans Google, au fur et à mesure de l’avancée du débat et des arguments. Le compte-rendu que fait Google de cette expérience, est – au-delà du bourrage de mou habituel de la firme – très intéressant. On y apprend d’abord que les gens utilisent énormément la fonction "define:" proposée par le moteur dès qu’ils butent sur un mot (en l’occurence "Maverick" ou "theocracy").
<Digression>M’appuyant sur un panel à peine moins représentatif que celui de Google (mes étudiants), il faut reconnaître que cette fonction (parfois assez indélicate et malgré l’existence d’une remarquable concurrence) remporte effectivement un énorme succès : c’est en effet le seul opérateur qu’ils retiennent sans que j’aie besoin de le leur répéter 17 fois. </Digression>
Donc les gens cherchent. Mais à relire le billet de Google, on s’aperçoit surtout de la fantastique opportunité que représentent pour lui ces grand-messe télévisuelles. Car pendant que les gens cherchent pour comprendre le discours, Google dispose du discours. Google est dans la situation du scientifique qui monte une "manip", une expérimentation, et qui s’efforce d’en contrôler la totalité des paramètres, des variables. Quand un candidat prononce le nom "d’Ahmadinejad" les gens cherchent
[Achmadinijad], [Akmadinijad], [Akmadinajad], [president Iran], [Iran leader]. Et alors ?
Alors avec ce genre de focale (un évènement dont on sait qu’il va – pendant une période de temps donnée – occuper l’attention d’une majorité de l’opinion), alors à cette échelle (des millions d’américains ont regardé ce débat), c’est l’occasion pour le moteur de faire ce que tous les puissants de ce monde (et aussi quelques scientifiques …) ont un jour rêvé de faire : sentir le pouls réel de la planète, de l’opinion, disposer de données très peu "bruitées" parce que centrées sur un événement donné, dans une fenêtre de temps fixe, mesurable. Difficile en effet, si l’on ne dispose pas du cadre, du contexte fourni par le temps du débat télévisé, d’apparier les requêtes déposées ([Akmadinajad], [president Iran] …) à une même entité référente ("Ahmadinejad"). Avec la grand-messe politique, Google tient sa source.
OK mais euh … et alors ?
Alors vous vous souvenez de ce que racontait l’autre jour Peter Norvig (Google Chief Scientist) à propos de l’intelligence des données ? Avec ce genre d’expérimentation politique à l’échelle d’un pays, Google peut se permettre d’avancer considérablement plus vite que les outils du web sémantique. Il peut littéralement "zapper" le recours à des logiques sémantiques au profit d’un apprentissage via des logiques d’auto-renforcement. Le volume des données traitées, "l’intelligence" que leur confère ce genre d’expérimentation sont, dans l’instant et à ce volume, beaucoup plus prometteuses et plus efficientes que ne peut prétendre l’être un web sémantique (ou sémantisé) toujours en manque d’un volume de données (et de métadonnées) suffisamment vaste ou suffisamment homogène.
Oui mais …
Oui mais le problème c’est que les données, même interprétées, même compilées à cette échelle, ne sont jamais exemptes de variables, d’imprévisibles, d’impondérables variables. Le fameux "grain de sable" capable de détraquer un immense engrenage. Tout ceci pose donc deux questions : l’architecture de Google, autant que son approche, autant que son quasi-monopole, le mettent aujourd’hui clairement en situation (délibérée ou non) de pouvoir fausser les représentations communes, et ce à l’échelle d’un pays, d’une nation. "Je me dis parfois que je peux sentir les sentiments du monde, ce
qui peut aussi être un fardeau. Qu’arrivera-t-il si nous répondons mal
à des requêtes comme "amour" ou "ouragan" ?" disait déjà Apostolos Gerasoulis (le papa d’Ask Jeeves, 4ème moteur de recherche au monde tout de même). Dans sa situation actuelle, Google peut légitimement se poser la question de savoir : "Qu’arrivera-t-il si je peux répondre ce que je crois être le mieux pour eux ?"
Quand les gens tapent [Akmadinajad], [president Iran] au moment d’un débat électoral majeur, qu’arrivera-t-il, que pourrait-il arriver si "je" les renvoyais vers des résultats même légèrement, même infinitésimalement partisans ?
Vous êtes perdus, vous ne voyez toujours pas où je veux en venir ?
Quand les gens ont cherché des informations sur l’EPR lors du débat télévisé français, que serait-il arrivé si on leur avait majoritairement affiché des sites renvoyant davantage à la version d’un candidat au détriment de l’autre ?
Ca y est ? Vous voyez où je veux en venir ?
Avec Wikipédia, nous avons encore la possibilité de contrôler, "d’éditer". Et être capable d’éditer, c’est encore être capable d’éditorialiser, et donc de contextualiser, de diversifier, de distancier. Avec Google nous sommes le nez dans le guidon, le nez dans le miroir, nous n’avons plus que la seule liberté de souscrire à l’ordre de la liste affichée de résultats. Alors bien sûr Google n’oriente pas les résultats en fonction de tel ou tel candidat. Bien sûr la question n’est pas là. La question est de savoir s’il est ou non aujourd’hui déraisonnable de poser de telles questions. Je pense que non. La question est de savoir combien de temps encore la neutralité des données, la neutralité de Google pourra résister aux sirènes de la puissance du politique. A mon avis plus pendant très longtemps. Une question annexe est de se demander s’il ne devrait pas être obligatoire de mettre l’ensemble de ces données à disposition de scientifiques confirmés et ("si possible" aujourd’hui ou "s’il
en reste" demain) non salariés de Google (ou d’une autre holding de
l’infotainment) ? Ou au moins de permettre auxdits scientifiques d’y mettre un peu plus que le bout de leur nez, ne serait-ce que pour avoir la certitude que Google ne sera pas tenté, un jour, de se poser la question "Qu’arrivera-t-il si je peux répondre ce que je crois être le mieux pour eux ?".
(Source : ReadWriteWeb, qui souligne et titre "Google has change political debate for ever" // Temps de rédaction de ce billet : 2 heures et 15 minutes)
<Update de plusieurs jours plus tard> Google s’intéresse également aux prochaines élections au parlement européen </Update>
Effectivement la lecture de ce billet m’a amené aussi à réfléchir à la neutralité de Google en particulier. Celle de Wikipedia, en tous les cas à l’instant T, aussi, même si, en effet, on peut encore penser avoir la main … La vraie question c’est de savoir qui va garantir la neutralité, si ce n’est celle qui se discute pour le net en général ? Et que dire de nos propres démocraties et de savoir qui contrôle ce que l’administration fait sur le réseau ? Ça, ce n’est pas déclaré à la CNIL !
Pour le reste, il y a aussi Twitter en sous-titrage sur Current TV, ou sur ses genoux pendant qu’on regarde le débat à la télé. Ceci couplé à la recherche de vérité que nous raconte donc Google, est-ce que cela fait changer des gens d’avis ? comment est-ce que cela joue ? il me semble que cela cristallise un peu plus les positions, donne du poids aux militants agissants. À ce propos, on ne peut que rajouter au panorama ce qui se passe avec Obama on line …
Il se passe des choses en effet, et je ne crois pas que l’on mesure à quel point.
Il me paraît important de prendre en considération que les “données” sont ici des statististiques portant sur l’interprétation de chaînes de caractères, fortement impactées par les translittérations plus ou moins régulières de noms étrangers à l’anglais dans l’exemple cité, par la configuration du clavier utilisé, l’idiolecte en fait des gens qui alimentent les bases de Google.
L’avantage de l’encodage sémantique est de reposer sur une langue formalisée destinée au calcul, avec une grammaire de référence.
Au moment de la campagne Présidentielle, l’UMP achetait bien le mot “banlieue” pour faire apparaitre en premier des liens sponsorisés un lien pour adhérer à l’UMP, google accepte donc de se faire “manipuler” par le politique (et même d’être payer pour cela ;-)même s’il essaye de différencier résultats sponsorisé et non sponsorisé…
Concernant l’affichage des résultats, il est indéniable que Google détient une “arme atomique” qui peut détruire des sociétés (ça s’est déjà vu – la société apparait à la dixième page du jour au lendemain alors qu’elle occupait sur certains mots clés la première place) et qui peut influencer les consciences sur des questions de fonds si le moteur tombe en de mauvaise mains(ça ne s’est pas encore vu…); mais la question essentielle est celle-ci : est que l’on ne demande pas trop à Google ?
Google doit il donner la bonne réponse à la question posée ou doit-il nous donner une liste de sites où l’on doit pouvoir trouver en bonne position les “mots clés” que nous avons nous même choisis pour aboutir à la réponse à notre recherche ?
Mais google veut aller plus loin : il analyse l’historique, nous propose des mots clés, substiue des mots clefs aux notres, analyse les clics des autres internautes…et nous propose des résultats annexes (plans, video…).
Le développement du web sémantique est donc paradoxalement dangereux car il va tendre vers une réponse bridée, voir unifiée que l’on ne va “plus pouvoir contrôler”. Nous n’aurons donc plus la maîtrise de notre recherche et donc des résultats…mais c’est un jeu dangereux pour le moteur qui doit rester le plus pertinent du marché. En conclusion, n’en demandaons pas trop à un moteur de recherche, il subsiste bon nombre d’autres ressources pour trouver les résultats de nos recherches; les étudiants d’aujourd’hui ne doivent pas l’oublier.
Les dangers du monopoles sont multiples et sont largement démontré. Outre le fait que ces systèmes ont de plus en plus de donné de masses qui nous auraient été impossible d’obtenir avant l’avènement d’internet, ce qui me préoccupe le plus est la structure du système elle même. En effet, nous tapons une requête sur internet et un certain nombre d’information nous sont présentée sous forme hiérarchique légitimé par le nombre de rétrolien. Ne trouvez vous pas que quelques choses cloche ? Nous indiquons à l’individu qui effectue la recherche, l’information qu’il devra prendre pour vrai. La dessous nous oublions que l’outil informatique qu’est google n’est qu’un outil (évolué certes). Malgré tous l’éducation des générations futures sur ces outils risquent d’être difficile à mettre en place. Il faut prier pour qu’il n’y est pas une culture internet mais des cultures internet afin que notre diversité continue de subsister
Le jour ou google fera autre chose qu’indexer de façon pertinente des sites internet, on n’utilisera plus google de la meme manière. Comme la wikipedia s’est corrigée “seule” de par sa nature, les internautes sauront chercher ailleurs ou autrement. Google s’est imposée à sa concurence par sa qualité, sans publicité, ni communication.Le jour, ou cela change ….
Politburo motorisé : Goobama ou MicroCain ?
Dans la série le politique et son reflet motorisé, et dans une quête éperdue de notoriété mise à mal, je vais donc sacrifier à la tradition médiatique. Teasing A la fin du billet que vous êtes en train de lire,