Vous connaissiez déjà la "base de donnée des intentions" ? Et bien voici venu le temps d’"Améliorer la recherche en devinant les intentions." Tel est le titre d’une conférence en ligne donnée à Stanford par Dan Russell (de chez Google) dans le cadre d’un séminaire sur les IHM (Interfaces Homme-Machine). L’idée n’est certes pas neuve, mais elle se précise. Quelques prises de notes :
——
Tout commence avec le classique problème des homonymies : "Quand vous tapez "Jaguar", que cherchez-vous en fait ?", animal, système d’exploitation, voiture, etc … question complexifiée par les types de contenus associés à la requête (image, vidéo, page web, actualité, etc …). Et le conférencier de s’exclamer : "When someone types ‘Google’ into Google, what can we possibly tell you !?".
Le problème peut apparaître très basique mais souvenez-vous qu’il peut aussi prendre rapidement d’intéressantes résonances philosophiques …
——
Plus tard (la vidéo fait plus d’une heure trente …), il revient sur la distinction classique entre requêtes :
- Informationnelles : 63%
- Navigationnelles : 15%
- et "Ressources" (=transactionnelles ?) : 22%
On constate alors l’émergence de 2 "macros" comportements de recherche ("session patterns") :
- une recherche en 2 temps : je localise un site puis je l’explore pour trouver la réponse.
- une recherche de type "téléportation" : je n’utilise pas Google, je vais directement au site-réponse.
Pour que ces stratégies soient fiables, Dan Russell souligne que : "Users need to have heavy metaknowledge about the ressource". Ce qui est le propre des chercheurs "avancés" qui semblent en sus caractérisés par le fait qu’ils utilisent la recherche par expression à bon escient (" …") et qu’ils changent l’ordre des mots de la requête (x,y) puis (y,x). Reposant au passage la délicate articulation
entre des pratiques "novices" et "expertes".
Plus globalement (c’est moi qui parle :), le problème de tout ce champ de recherche est que l’on postule l’intentionalité du chercheur. (là c’est de nouveau le conférencier qui parle 🙂 On suppose qu’il a un but en tête. Et on fait donc l’impasse sur ceux qui se "balladent" ou errent sans but véritable. Il est donc impossible de déterminer la part de la sérendipité à cette échelle d’observation.
——
Il semble que l’un des outils méthodologiques les plus surveillés par l’équipe IHM ("Usability labs") de chez Google soit en fait la fonction "refine search" qui (je n’y avais jamais pensé en ces termes) est un remarquable indicateur permettant d’établir des corrélations entre ce que les gens tapent et ce qu’ils cherchent "en fait" parmi la liste proposée. Entre les deux se construit une échelle d’intentionalité qui semble observée de très près par Dan Russel.
——
Et là, au bout de 58 minutes de diffusion, alors qu’il en restait à peu près encore une bonne demi-heure … c’est le crash. Impossible de relancer. Je ne saurai donc jamais si lemoteur de divination est pour demain 🙁
——
A noter aussi vers la 42ème minute, une vidéo d’eye-tracking assez sympathique (pour ceux qui n’en ont jamais vu, comme moi)
(Via Rashmi Sinha)
Dans le même ordre d’idée (quoi Google n’a rien inventé?):
“Automatic Identification of User Goals in Web Search (PDF)”
http://oak.cs.ucla.edu/~cho/papers/cho-usergoal.pdf
J’ai déjà suggéré à Jean de reproduire l’expérience avec ses étudiants… (à suivre… 😉 )