Chercher des textes ou trouver des mots. La recherche à la hash(tags)

Les premiers systèmes d'indexation furent mis en place pour faire face à un triple problème :

  • l'initiale rareté / fragilité des supports de l'écrit et la difficulté de leur accessibilité
  • l'impossibilité d'une lecture extensive face à la multiplication des textes (et donc la nécessité d'un repérage des idées importantes)
  • enfin, à une époque beaucoup plus récente, la nécessité de disposer d'un vocabulaire suffisamment "appauvri" pour être commun à différentes communautés (vocabulaire contrôlé) et pour pouvoir être contenu sur les premiers supports des premières "méta-informations" (les cartes à jouer qui furent utilisées comme support de catalogage pendant la révolution française)

Trois cadres qui volèrent naturellement en éclat au fil des ans, et particulièrement avec l'arrivée de l'informatique puis du "tout" numérique dans la chaîne de traitement documentaire.

3 champs se développent aujourd'hui en parallèle autour des routines et processus di'ndexation :

  • celui des vocabulaires contrôlés "professionnels" (thésaurus, classifications documentaires diverses – Dewey bien sûr mais également RAMEAU, etc …)
  • celui des ontologies et du web sémantique
  • celui de l'indexation "libre" : à savoir les folksonomies et les #hashtags

Lesquels #hashtags ont donc récemment débarqué sur le premier écosystème documentaire fermé de la planète : Facebook.

Le printemps hashtag.

J'ai déjà écrit ici pourquoi les hashtags me semblaient occuper une place de première importance dans notre rapport "documenté" au monde. Je voudrais dans ce billet souligner en quoi leur généralisation et leur adoption par l'ensemble des grands acteurs documentaires (Google, Facebook, FlickR, Twitter, Pinterest, Instagram, Vine, etc …), tout en maintenant la concurrence des procédures d'indexation "normées et contrôlées" (ontologies, web sémantique, langages documentaires), pourrait progressivement transformer nos manières d'interagir avec l'information et de "faire mémoire", mais également dans une certaine mesure nous "libérer" des entraves de la personnalisation et des navigations guidées ou surveillées qui conditionnent aujourd'hui l'essentiel de nos interactions connectées.

Après les premiers "annuaires" de recherche, les premiers moteurs inversèrent à 180° l'angle, l'approche et les objectifs de l'indexation : chaque mot comptait, tous les mots étaient indexés, s'ensuivait une pondération liée au nombre d'occurences. Et Google arriva qui dans le coeur de son algorithmie fit le choix "d'oublier" les mots des textes eux-mêmes au profit des externalités documentaires qui les circonscrivaient et s'y trouvaient reliés par les hyperliens.

#Bibliothèques

D'Alexandrie à la la BNF, nous ne pouvions trouver des textes que si nous avions connaissance des mots (index) qui en rendaient compte en leur assignant une "place" à la fois physique (leur rayonnage) et symbolique (leur "appartenance" classificatoire, disciplinaire ou thématique). Ces mots, ces index, étaient des extériorités textuelles. Leur capacité à décrire finement le contenu des textes qu'ils représentaient ne nécessitait aucunement leur présence dans le texte décrit, pas davantage qu'un nombre d'occurences élevé.

#Moteurs

D'Altavista à Google, nous étions à la recherche de textes par la médiation algorithmique du poids des mots les composant ou les re-liant. Pour le premier, l'indexation comme extériorité devenait inutile. Pour le second, elle redevenait essentielle mais appartenait à chacun et en dehors de toute logique consciente (le choix des mots figurant le lien hypertexte n'est pas pensé comme une entrée d'index ni comme un descripteur). Pour eux deux elle ne nécessitait plus aucune médiation professionnelle. Au "jouir sans entrave" faisait écho un "donner accès sans contrainte". La "contrainte" de l'indexation avait basculé du côté de la machine, de l'algorithme, du 0 et du 1, elle s'était dés-humanisée, elle n'était plus acceptable. Le hiatus se fit alors criant entre le monde des bibliothèques, de l'information "structurée", de l'accès restreint et contrôlé aux seules métadonnées des textes, et celui des moteurs, de l'indexation "libre", de l'accès universel et instantané aux textes eux-mêmes.

#Profils

La réunification de ces deux mondes antagonistes se fit selon une modalité inédite. Une humanisation documentaire et documentée. L'Homme devint un document comme les autres.

Assignation (les vocabulaires contrôlés) et extraction (automatique, "full text") furent donc longtemps les deux seules modalités exclusives permettant de trouver des documents et d'y accéder. Avec la recherche de la constitution d'un pan-catalogue des individualités humaines, l'extraction changea de camp (pour passer dans celui de la "machine algorithmique) et l'assignation changea de sens (pour passer du côté du marketing et des logiques d'audience).

Puis vinrent les folksonomies et les hashtags.

La recherche à la hash(tag)

<HDR> Les hashtags. Une indexation libre, non-contrainte, parfaitement subjectivée et d'une subjectivité parfaitement assumée, au coût cognitif nul, non structurée, collaborative, participative ou contributive selon les cas, symbolique plutôt qu'analytique. Les hashtags, qui jouent de la polysémie parfois jusqu'à l'épuisement du troisième ou quatrième degré de compréhension possible, qui abolissent le hiatus temporel qui présidait autrefois à la publication ou à la mise en circulation d'un document et à sa préhension possible par le biais d'un système de descripteurs relevant de logiques de castes oeuvrant pour un possible bien commun sans toujours percevoir le coût cognitif exorbitant ensuite demandé à ceux manifestant le souhait d'en jouir sans entraves. Les hashtags, repoussant toute vélléité logiciste ou toute tentative d'objectivation au profit d'un empirisme assumant et revendiquant ses essais et ses erreurs. <nota-bene> le contenu de ce paragraphe est explicité et illustré dans ce diaporama, z'avez juste à remplacer "folksonomies" par "hashtags" </voila>

Les #hashtags, dernier avatar folksonomique d'un monde outrancièrement documenté, sont la marque d'une libération, d'un affranchissement. Ils sont l'éclat de rire d'un monde dans lequel chacun a envie de se vivre un instant seulement en potentiel héritier de cette figure tutélaire de la guérilla linguistique que fut le Google Bombing, en assignant à la page web du président des états-unis le seul mot clé de "miserable failure", en faisant de Nicolas Sarkozy un énième "trou du cul".

Les hashtags. La marche du sous-prolétariat de l'indexation face à l'hégémonie d'un capitalisme linguistique qui assigna à chaque mot une valeur d'enchère. Les hashtags, dérisoires, frondeurs, libertaires, salvateurs, salutaires. Jeu oulipien des écrivains, vannes à deux balles des lycéens, concaténations improbables et glauques, surgissements poétiques, liant devenu indispensable à toute recherche d'unité dans un monde de publications toujours plus fragmentaires. Dans tout écosystème numérique, les hashtags sont à la publication ce que les hyperliens sont à la lecture, une architecture. L'architecture disait Plotin c'est "ce qui reste de l'édifice une fois la pierre ôtée". Le hashtag c'est ce qui reste du sens une fois la pierre du document ôtée : un contexte, une différance aussi mouvante que les communautés, les individus, les temporalités, les lieux et les événements ayant contribué à son édification. La possibilité de réinventer l'ensemble. Non plus seulement la possibilité de retrouver un texte, une image, un document parmi d'autres, mais la possibilité d'en réinterroger la pertinence, d'en réinterpréter les traces documentaires persistantes, la possibilité d'y naviguer sans autre but que de s'y perdre, que de flâner dans cette brocante du sens riche de la patine de toutes les appropriations ou détournements documentaires dont chaque hashtag fut la trace et l'objet. De profiter de cette altération tonique, de ce mot "dièse". De mesurer ce que ces mots-dièses ont apporté comme bémols à la compréhension des outils linguistiques dont nous avions l'impression de maîtriser les gammes. </HDR>

#CherchesLeMotEtTuTrouverasLeTexte

#EtReciproquement

D'Alexandrie à Google nous cherchions des mots nous permettant de trouver des textes. La recherche d'un texte imposait de trouver le ou les mots y donnant accès. Avec les hashtags nous cherchons d'abord des documents nous permettant de trouver des mots. La recherche d'un mot, d'un hashtag, impose de trouver le ou les textes, le ou les documents y donnant accès. Là où l'indexation professionnelle "classique" et normée faisait voeu d'aridité, là où l'indexation "full-text" des moteurs de recherche faisait voeu d'exhaustivité, nous cherchons ces hashtags, ces mots-dièses, qui sont nourris d'un
contexte documentaire dont ils condensent l'entièreté de la valeur.

Indexation impressionniste.

C'est au détour d'un Tweet que j'ai découvert l'outil Tagboard qui permet de rechercher des hashtags sur différentes plateformes. Un méta-moteur de hashtags comme méta-données.

Sensdelavie

Cet outil, dans la logique décrite dans ce billet, inverse réellement notre rapport à ce qui reste un outil de recherche. Il bouleverse notre affordance à l'objet autant qu'à la tâche cognitive qui lui est associée.

Lorsque l'on cherche quelque chose sur un moteur de recherche, particulièrement dans le cas de requêtes transactionnelles mais pas uniquement pour autant, nous déclenchons, nous amorçons une tâche cognitive qui ne se clôturera que par la consultation du ou des documents permettant de satisfaire aux critères présents au démarrage de la tâche ou élaborés et définis au fur et à mesure de l'itération et de l'affinement de celle-ci. Il est fréquent que la consultation d'un document nous amène à la lecture d'un autre, il est aussi encore assez fréquent que nous nous égarions en cours de tâche ou que nous perdions la conscience du contexte de tâche au cours de notre navigation, mais l'essentiel de nos navigations par l'entremise des moteurs restent pour l'essentiel des déplacements d'un point A à un point B. Je cherche quelque chose par l'entremise de celui-ci (Google comme point A) que je sais que je vais trouver par ici (le site ou produit recherché comme point B). Les hashtags permettent à la navigation de cesser d'être un déplacement pour redevenir un voyage, une flânerie, une errance.

Ceci n'est pas une tour Eiffel.

Lorsque je tape "tour eiffel" dans Google Images, je cherche une photo de ce monument qui soit la plus fidèle possible, je cherche une série de reproductions, je cherche une définition, je cherche au niveau le plus bas possible de la documentation du monde, une itération de re-présentations de bas niveau.

Toureiffelgoogle

Lorsque je tape "#toureiffel" dans tagboard je cherche des récits de vie qui gravitent autour de ce monument, qui le documentent, dont je me moque qu'ils mentent.

Toureiffeltagboard

Lorsque je tape "sens de la vie" sur Google je cherche un document qui selon mes convictions et mon envie du moment sera soit un texte philosophico-religieux, soit un chef d'oeuvre absolu du 7ème art. parce que les moteurs de recherche indexent tout. Et qu'il existe donc nécessairement une réponse. La possibilité d'une réponse unique, circonstanciée et personnalisée efface la possibilité de la recherche d'un simple questionnement autour de notre requête. En tapant "#sensdelavie" sur Tagboard ou dans l'un des biotopes documentaires qu'il "indexe", je ne cherche pas un document sur le sens de la vie. J'effectue une requête qui est à la documentation ce que l'impressionnisme est à la peinture. Je ne cherche pas à trouver. Je cherche à comprendre. Je ne cherche pas à réduire une complexité que je sais contingente, je cherche à l'étendre, je cherche à en mesurer l'étendue.

#cecinestpasunepipe

La premier hashtag n'est pas apparu sur Twitter. Il ne date pas du 23 août 2007. Ce n'est pas celui-ci (source). Pas davantage dans les premiers systèmes de messagerie de type IRC. Il n'était pas précédé par un dièse. Le premier hashtag date de 1928. Son auteur s'appelle René Magritte.

MagrittePipe

Ceci n'est pas une pipe. Mais #CeciEstLePremierHashtag. Le hashtag est la part surréaliste de l'indexation. #toutsimplement

 

4 commentaires pour “Chercher des textes ou trouver des mots. La recherche à la hash(tags)

  1. hmmm, si on accepte la proposition de “ceci n’est pas un pipe” comme étant un hashtag, il ne saurait en tout cas prétendre au rang de “premier” hashtag. avant qu’on en découvre encore un / des / une multitude de / premier(s), il y en a un de 1919 qui s'(im)pose un peu là : L.H.O.O.Q.
    #etencoreunevictoiredecanardDuchamp!
    #nemeremerciepas

  2. En lisant ce billet (http://www.webmarketing-com.com/2012/07/04/14736-jai-teste-pour-vous-les-tweets-sponsorises) je me suis demandé si, au contraire de ce que tu esquisse dans ton article, les hashtags n’allaient pas devenir un nouveau rouage du capitalisme linguistique ?
    Voire, tout du moins, d’une forme de capitalisme cognitif (orientation des internautes, captation et régulation des internautes), si ce n’est contextuel…
    Mais peut-être suis-je trop “optimiste” sur les capacités d’accaparation et de “clôture” des industries du web 🙂

Répondre à bituur esztreym Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut