Son vélo a crevé. C’était le web.

"Son vélo a crevé."

"Son vélo a crevé." Cette phrase est une synecdoque. Une synecdoque est une figure de rhétorique dans laquelle "la relation entre le terme donné et le terme évoqué constitue une inclusion ou une dépendance, matérielle ou conceptuelle."

"Je cherche un truc sur Google."

"Je cherche un truc sur Google." Cette phrase est une métonymie. Une métonymie est une figure de rhétorique dans laquelle on remplace un mot par un autre à partir où ces deux mots "entretiennent une relation qui peut être : la cause pour l’effet, le contenant pour le contenu, l’artiste pour l’œuvre, la ville pour ses habitants, la localisation pour l’institution qui y est installée…" Là en l'occurrence, on ne cherche pas un truc "sur Google" mais "sur le web". Google c'est la partie prise pour le tout.

Une synecdoque est une forme particulière de métonymie. Fin des considérations rhétoriques.

Copier. Coller. Générer. Piller. Web-scrapping et content spinning.

Le "scrapping" c'est du copié-collé automatique. Plus exactement :

"Cela permet de récupérer le contenu d’une page web en vue d'en réutiliser le contenu. Cette opération se pratique le plus souvent de façon automatique, qui permet de constituer des pages à bon compte. Cette pratique n'a pas très bonne presse chez les contributeurs authentiques car elle peut être assimilée à un pillage. Pour inciter les webmasters à ne pas utiliser de méthode de web scraping, Google, sanctionne les sites qui les utilisent en les supprimant de ses pages de résultats."

Le "content spinning" c'est de la génération automatique de contenus. Plus exactement (j'en avais fait un joli billet) :

"à l'aide d'outils linguistiques il est possible (…) d'effectuer des opération de "content spinning" : littéralement "essorage" ou "filage" de contenu. Sur la base d'un texte original, ces outils permettent d'en produire plein d'autres en opérant de légères, subtiles et presqu'indécelables variations dans la syntaxe, la ponctuation ou le vocabulaire utilisé. L'idée (…) est d'influencer le positionnement en multipliant les sites satellites composés de reprises déclinées d'un même texte."

Voici donc 2 pratiques qui sont (pour l'essentiel) clairement du côté obscur de la force. Et contre lesquelles les moteurs s'efforcent de lutter. Fin des considérations SEO.

Et soudain c'est le drame.

Si Google est une figure métonymique du web, c'est parce qu'il en est effectivement le premier et le meilleur indexeur. La porte d'accès principale.

Si Google est une synecdoque du web, c'est parce que sa position "métonymique" (partie prise pour le tout) a progressivement mais inéluctablement fini par constituer une relation d'inclusion et de dépendance : le web est dépendant de Google. Plus exactement, les "acteurs" du web – ceux qui publient, produisent des contenus et sans lesquels il n'est pas de web – sont devenus dépendants de Google (économiquement, en terme de visibilité, pour plein de services auxquels nous avons quotidiennement recours, etc.)

Si Google fait du content spinning, c'est parce que depuis la généralisation (fin 2012) du Knowledge Graph, c'est à dire de la version d'un web sémantique à la Google, il a progressivement installé, encapsulé, inclus au coeur même de ses pages de résultats des contenus agrégés à partir de différentes sources (Wikipédia principalement mais aussi d'autres sites partenaires). Il l'a fait dans une logique de service (plus pratique d'avoir directement les infos que d'avoir à cliquer sur différents sites) mais il l'a surtout fait pour maintenir au maximum l'internaute dans les rêts de son écosystème, comme je l'avais longuement démontré dans ce billet :

"En cela, l'arrivée de la sémantique au coeur de l'algorithmie de recherche est au moins autant un accomplissement qu'un nouvel asservissement, une nouvelle forme d'enfermement."

Et si Google fait du scrapping, du copier-coller, c'est parce que, comme nous l'apprennent simultanément Barry Schwartz sur SearchEngineLand et Olivier Andrieu sur Abondance, il vient de passer à la vitesse supérieure.

Spinning

Vous posez la question "Comment faire" et vous avez presqu'entièrement la réponse.

Donc je résume.

Voici un moteur qui est celui qui indexe le plus de pages web.

Voici un moteur qui conditionne des pans entiers de l'économie numérique de la planète.

Voici un moteur qui s'arroge le droit de réécrire certains contenus s'ils le conviennent pas à son algorithme (moteurs scripteurs).

Voici un moteur qui retire chaque jour de son index des milliers de page suite à des demandes d'ayants-droits et nous offre donc une vision très orientée du monde en lieu et place de la supposée objectivité et neutralité algorithmique sur la quelle il fut fondé (et l'opposition entre "matching" et "watching").

Voici un moteur qui, en sus de sa base de "cache", encapsule et recompose dans ses pages de résultats des contenus aspirés à partir de sources extérieures (Knowledge Graph). Sans trop tordre la réalité, nous ne sommes plus très loin d'une forme explicite et assumée de web spinning. 

Voici un moteur qui suggère des réponses. Voici un moteur qui affiche des résultats avant même que vous n'ayez posé ou même saisi la question. Le complexe du scribe.

Voici un moteur qui capitalise sur les mots et invente le capitalisme linguistique.

Voici un moteur qui sait pouvoir s'appuyer sur la dispartion prochaine de l'affichage des adresses (URLs) pour conforter encore son monopole et notre dépendance, d'autant qu'il va lui-même vendre des noms de domaine.

Et voici un moteur qui désormais "scrappe", copie-colle" des extraits de sources extérieures, lequel affichage a pour conséquence directe que l'on n'a plus besoin d'avoir recours à ces externalités, que l'on n'a plus besoin d'aller voir la page où se trouve la réponse, puisque la réponse est copiée-collée dans Google (toujours le complexe du scribe).

Voici un moteur qui va devoir inéluctablement affronter sa schizophrénie avant de devoir en rendre compte devant ses utilisateurs. Car oui, Google est schizophrène. Ou plutôt bipolaire. Condamné par vocation à brasser le maximum de contenus en temps réel. Condamné par nature à conserver une partie de ses contenus dans des formes allant du "cache" au fichier "d'index inversé". Condamné par fonction à s'appuyer sur les données sémantiques présentes pour organiser et redonner forme, pour recomposer des contenus adaptés aux attentes des utilisateurs. Condamné par modèle économique (celui d'une régie publicitaire) à capter et à garder au maximum en son sein, proche de ses annonceurs, le temps d'attention et de présence en ligne du maximum d'entre nous.

<Histoire de simplifier le bouzin> Accessoirement (ou pas …) ce type de stratégie va par ailleurs inéluctablement finir par renvoyer sur deux autres débats lourdement épineux : celui de la question et de la gestion des droits (la reprise des données issues de Wikipédia dans le cadre du Knowledge Graph est légitime au regard des licences creative commons de Wikipédia, encore que on pourrait discuter … mais la totalité du web n'est pas "libre de droits", y compris pour des contenus sous le régime des licences creative commons par rapport auquelles la réutilisation et le remixage par Google dans le cadre économique d'une régie publicitaire pose de nouvelles questions …), et celui de la neutralité du net et de la priorisation de certaines sources. </histoire de simplifier le bouzin>

Google est un moteur de réponses qui ne se pose plus aucune question. Ce qui constitue aujourd'hui sa plus grande force mais pourrait devenir demain son talon d'achille : parce qu'il pourrait finir par s'effondrer sous son propre poids, parce qu'il pourrait finir par provoquer l'émergence de nouvelles externalités "radicales" et techniquement hors de (son) contrôle.

Dessine-moi un Google. Pour que je ne sois plus un mouton.

D'accord mais avant un rappel. Le web se compose de deux faces. Et d'une tranche.

Des externalités d'abord. Les "pages" web que chacun produit, mais également les grands écosystèmes envisagés isolément. Ainsi Facebook considéré en lui-même est une "externalité" du web, comme l'est Twitter, comme l'est Amazon, comme l'est le site de la SNCF, etc.

Des internalités ensuite. A l'échelle d'un site web, une page est une internalité du site. A l'échelle d'un blog, un article est une internalité dudit blog. A l'échelle de Facebook, un profil est une internalité.

Une tranche enfin (sinon ce serait trop simple). Une tranche unissant ces deux faces. Cette "tranche" c'est la manière dont internalités et externalités coopèrent, s'adaptent ou s'opposent. Juste quelques exemples :

  • pour Google, les pages web est les articles sont des externalités. Google et les moteurs de recherche se sont construits sur des externalités. Ils ont un besoin littéralement "vital" de ces externalités car eux-même ne produisent rien sauf de la valeur liée à la capacité de repérage et d'accès qu'ils permettent.
  • Pour Facebook, un profil est une internalité. Facebook et les grands écosystèmes que Tim Berners Lee baptise les "jardins fermés" n'ont pas "besoin" des externalités du web. Ou plus exactement ils en ont besoin en phase d'amorçage, et cherchent ensuite à se les approprier totalement, à les phagocyter, à les transformer en autant d'internalités. L'exemple archétypal de cette transformation et de ce phagocytage est naturellement celui du "like" de Facebook. Autre exemple : Dans Facebook, des internalités (les profils) "partagent" des contenus "externes" (des vidéos YouTube par exemple) mais le cadre du "partage" et de la consultation – et les CGU de Facebook … – tranforment ces externalités perçues en autant d'internalités vécues.

Et donc je te dessine Google.

Ça c'est un mouton.

Mouton

Et ça c'est Google.

Möbius_strip
Et oui. Tu as reconnu le ruban ou l'anneau de Möbius, curiosité mathématique qui ne possède qu'une seule face (tu le parcours en passant ton doigt dessus et … ton doigt n'en fait jamais le tour puisqu'il passe sans cesse de la face externe à la face interne qui n'en constituent donc qu'une seule). Une curiosité topologique : un ruban à une seule face et à un seul bord que les mathématiciens appellent une surface "non-orientable". C'est fascinant.

Le rapport que Google installe entre internalités et externalités est celui d'un anneau de Möbius. C'est à dire que l'on ne sait jamais sur quelle face (interne ou externe) on se trouve. C'est à dire que quelque soit notre point de départ, on se retrouve toujours sur la même face (interne ou externe) sans que cela ne revête plus une quelconque importance pour nous.

Et cette "image" vaut autant du point de vue de la navigation et du parcours de chaque internaute, que du point de vue de la production de contenus. Contenus qui se trouvent ainsi brassés, indexés, copiés, collés, conservés, cachés, remixés, ré-agencés dans une même linéarité de consultation et d'accès qui abolit et neutralise ou "naturalise" leur nature propre, c'est à dire le fait qu'ils soient – les contenus – des externalités produites ou des internalités re-produites.

La data-fication n'est plus une data-fiction.

Ce phénomène n'est d'ailleurs ni étonnant ni nouveau. Dans un vieux billet de 2005, "Möbius,  le web 2.0 et Darwin" (et oui, il y a presque 10 ans), je décrivais déjà ce phénomène comme inexorable et inéluctable. Et je prenais comme source un autre billet (qui a disparu …) dans lequel Adam Green d'écrivait l'explosion du phénomène de "data-fication" du web :

"L'explosion dont il est question concerne la bascule des contenus d'un site web d'une internalité à une externalité. Au lieu qu'un site web ne soit un "lieu" dans lequel les données "sont" et vers lequel d'autres sites "renvoient", un site web sera une source de données qui seront elles-mêmes dans de nombreuses bases de données externes, dont celle de Google (GoogleBase). Pourquoi alors "aller" sur un site web quand tout son contenu a déjà été absorbé et remixé dans un flux de données collectif ('collective datastream')."

10 ans plus tard, 10 ans après l'explosion, les retombées "data-actives" sont mesurables. Le web continue chaque jour de se scinder davantage entre des vecteurs d'internalités (les grands écosystèmes ou jardins fermés comme Facebook), des externalités survivantes mais de plus en plus obscures parce que de plus en plus dépendantes (ce blog en est une au même titre que les milliers d'autres blogs mais aussi au même titre que des data-monuments comme Wikipédia), et ce vortex attentionnel d'apparence biface mais naviguable sur celle unique de l'anneau de Möbius qu'est Google à lui seul.

Son vélo a crevé.

Ce qui me ramène au titre de ce billet. Et à notre vélo. Que faire face au prochain et au plus que probable accident synecdochique ? Quand à force de dépendance contrainte, ce qui ne devrait en être qu'une roue finira par constituer l'ensemble du vélo ? Et quand notre vélo, quand notre web sera crevé ? Comment trouver la source de la crevaison ? "Elle est forcément sur l'une ou l'autre face de la roue" me direz-vous. A moins que ladite roue ne soit elle-même …

Diapositive1

 

 

2 commentaires pour “Son vélo a crevé. C’était le web.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut