La technique est d'abord un rapport au corps. Chaque année je me régale à expliquer aux étudiant.e.s du meilleur DUT Infocom de la galaxie connue comment et pourquoi par exemple, le passage du Volumen (le livre en rouleau) au Codex (le livre sous sa forme actuelle) a d'abord été une révolution de la posture (en libérant une main pour prendre des notes, en permettant d'en manipuler plusieurs à la fois, etc.) avant d'être une révolution cognitive. Chaque année je leur montre cette vidéo de Michel Serres qui explique (bien mieux que je ne le ferai jamais) toutes ces choses là et tant d'autres encore.
Chaque évolution technique modifie notre posture corporelle, et donc notre rapport à la technique. La miniaturisation, constante dans l'histoire de l'informatique, n'est pas uniquement là pour régler des problèmes d'espace (de stockage) mais là encore de manipulation. Faire tenir dans la main. "Maintenant, tenant en main le monde." Michel Serres encore.
J'ai moi-même beaucoup travaillé et écrit sur ce que les évolutions du web et des plateformes (et de leurs interfaces) disaient de notre corporéité et de notre rapport au corps, de la manière dont nous faisions corps, dont certaines parties de ces technologies étaient "détachables" de notre corps et d'autres non ("détachable" au sens où Simondon explique "qu'un objet technologique est produit lorsqu'il est détachable" ; vous pourrez par exemple revisionner le diaporama de la conférence "traces du corps" ou encore mon "Homme de Vitruve numérique").
Le lien (hypertexte) au corps.
Depuis l'origine du web, on "navigue", le bateau c'est notre "browser" et le web c'est l'océan, on a un corps de marin. Puis on "surfe", notre planche c'est le smartphone et la vague c'est encore le web, on a un corps de surfeur. Puis on "publie", on a un corp(u)s d'éditeur. Puis on "poste", on a un corps … de facteur 😉
Beaucoup d'interfaces tiennent désormais non seulement dans notre main mais elles sont aussi tactiles, haptiques ; pour nous permettre de voir, elles déposent des écrans noirs sur nos yeux : la réalité augmentée, virtuelle, est faite de corps soit totalement immobiles, soit s'agitant étrangement, semblant en permanence chercher la bonne posture, la bonne gestuelle ; des corps regardés par les non-appareillés comme autant de Quichottes affrontant d'invisibles moulins, comme irréels.
Et voici donc qu'arrive maintenant la prochaine promesse technologique : celle de la navigation … faciale.
Navigation faciale ?
Fonctionnalité mise en oeuvre par Google dans son système d'exploitation Android 12, il s'agit de pouvoir naviguer uniquement à l'aide des mouvements de son visage. Ouvrir la bouche pour "aller à l'élément suivant". Sourire pour "sélectionner un élément". Hausser les sourcils pour "retourner à l'élément précédent".
Naviguer littéralement "à l'oeil". Quoi de plus logique finalement que l'interface repose sur notre … face ? Ne plus être rien d'autre qu'un smiley actanciel. Miroir sémiotique tendu d'une écriture dont l'expressivité et la part agentive semblent souvent soluble dans l'usage des smileys et qui nous saute littéralement "au visage", le transformant en smiley. Notre "visage-smiley" permettant de naviguer dans des écritures remplies de smileys. Le "visage-smiley" à la fois support, agent, expressivité et expression. Assez vertigineux.
Plus que jamais la société des visages dévisage. Nous sommes dans le World Wide Face. La question du visage (et de la reconnaissance faciale) demeure structurante et déterminante. Même si l'on nous promet que le calibrage des expressions restera stocké "en local", derrière cette navigation faciale il y a bien sûr une nouvelle itération de la logique permettant de toujours mieux contrôler nos visages, nos identités, mais aussi nos humeurs et nos sentiments. Car si les navigations faciales élémentaires ne nous conviennent pas, ou si elles sont trop incommodes ou limitées, on peut, on devra c'est certain, en paramétrer d'autres, à notre guise. On décidera ici qu'un clin d'oeil gauche ouvrira une nouvelle fenêtre, qu'une bouche en cul de poule lancera une vidéo, que tirer la langue permettra de fermer une fenêtre. Chacun son visage. Et chaque partie du visage comme autant de boutons déclenchant des actions.
La navigation par l'acné comme l'acmé d'un monde où notre attention étant déjà captée et essorée à l'infini à chaque instant, il s'agit maintenant d'obtenir notre méconsentement** à faire de notre visage une interface et de chacune de nos expressions, une simple fonction. L'économie de l'attention étant assurée, il faut alors se centrer sur l'économie de l'occupation. On nous occupe à en permanence nous occuper de nous. Et nous sommes en permanence pré – occupés. Et cette pré – occupation renforce et densifie encore les stratégies de captation de l'attention.
___________________
** Même si personne n'est "obligé" ou "contraint" de mettre en place cette navigation faciale, j'ai du mal avec l'idée que cette mise en oeuvre puisse pour autant reposer sur un consentement libre et éclairé. Je propose donc le néologisme de "méconsentement" pour décrire ce processus dans lequel on réclame votre consentement pour des mises en oeuvre dont on ne maîtrise ni l'enjeu ni l'amplitude réelle et où l'anecdotisation du recueil individuel de ce consentement masque difficilement des enjeux collectifs pour lesquels jamais notre agrément collectif ne pourrait être obtenu.
___________________
La fonction dévisage.
Faire de notre visage une fonction. De nos grimaces une action. De nos mimiques un bouton. Au risque de reléguer au second plan, l'autre fonction de notre visage depuis une éternité : celle d'être la première grille de lecture de l'altérité. La première chose que l'on voit de l'autre c'est son visage. La première chose que l'on cherche à faire sur le visage de l'autre c'est le déchiffrer, c'est comprendre ce qu'il veut au travers de son expression, singulière, sienne, nécessairement prise dans un jeu social parce que l'autre, dans une interaction sociale établie ou recherchée, nous voit le regardant. C'est cela qui peut encore changer. Nous couvrons nos corps de vêtements connectés (World Wide Wear). Nous couvrons nos visages de lunettes et casques également connectés mais qui de fait les dissimulent. Nous sommes en permanence soumis à des scrutations intrusives dans chacun de nos espaces publics ou privés de circulation (vidéo-surveillance). Et maintenant il s'agit aussi de réduire l'infinité des expressions singulières d'un visage à une liste limitée et déterministes de fonctions techniques.
J'entends bien sûr les usages appliqués, en médecine notamment lorsque les mains sont déjà occupées à autre chose et qu'il s'agit d'amplifier les tâches possibles pour, par exemple un chirurgien au bloc ou opérant à distance. J'entends aussi bien sûr les applications aux personnes en situation de handicap. Et puisque l'on va, plus bas dans cet article, évoquer les super-héros, j'ai toujours été frappé d'histoires comme celle du scaphandre et du papillon, dans lesquelles des être humains enfermés dans un corps dont seule une infime partie fonctionnait encore, parvenaient à établir une communication leur permettant d'écrire des livres entiers au seul battement de leur paupière.
Mais je vois aussi, d'abord et avant tout, la réduction de l'infinité de palettes expressives infiniment singulières et universelles à la fois (quoi de plus universel que le sourire) à la peau de chagrin d'interfaces fonctionnelles "envisagées". Car chaque nouvelle technologie arrivant dans le champ social, a fortiori de manière massive et simultanée, ne produit pas seulement des effets de facilitation ou de capacitation, elle produit de la norme. Et cette norme limite et standardise les expressions singulières. Ce n'est donc pas la navigation faciale qui pose problème ou question, mais le fait qu'elle puisse à court terme s'installer comme nouvelle norme.
Interfaces et intériorités.
La technique est d'abord un rapport au corps. D'abord il a fallu que notre corps s'outille pour se projeter vers l'interface : c'est l'invention (notamment) de la souris et la mère de toutes les démos lorsque Douglas Engelbart pose ce bout de bois taillé sur une table et bouge sa roue crantée. Un dispositif à l'extérieur de la machine et de l'écran qui nous permet de faire bouger à l'intérieur de la machine et de l'écran. L'extériorité d'un corps manipulant se projetant à l'intérieur d'un écran. Et puis les écrans deviennent "tactiles". L'interface n'est alors plus l'occasion pour une extériorité de manipuler une intériorité mais elle est un effleurement, une membrane, un point de contact.
Dans l'espace public ces interfaces tactiles sont très présentes mais très peu utilisées, elles apportent "un statut symbolique de modernité et de luxe dont la non-utilisation même renforce l'attribut". Mais dans l'espace privé que matérialise notre smartphone, l'interface tactile est notre point de contact membranaire permanent avec l'extérieur. On touche à tout. Et pour toucher on dispose d'une gestuelle normée :
(Via Charlene Cardoso)
Et là encore on observe le déterminisme de formes d'habilités qui contraignent le corps dans – entre autres – la mobilisation d'une ou deux mains :
(Via Charlene Cardoso aussi)
Il y a tout un travail de design anthropologique de nos gestes techniques, que Nicolas Nova – entre autres – explore brillamment depuis plusieurs années (ici ou là)
Et puis vient le moment où plutôt que d'appareiller la machine avec différents dispositifs d'entrée ou de sortie, c'est notre corps que l'on appareille : lunettes connectées, vêtements connectés, casques et gants de réalité virtuelle. Ce n'est plus nous qui allons vers la machine ou les écrans mais l'inverse. Ce n'est plus nous qui allons effleurer, c'est nous qui sommes appareillés et appariés. Et nous nous effleurons nous-mêmes.
Tout est prêt pour qu'advienne la navigation faciale. Parce que chaque élément de notre corps doit être actionnable pour la machine ou pour le réseau. Et qu'il reste à actionner le visage. Mais quand nous paramétrons les expressions de nos visages pour qu'elles déclenchent une action dans une interface, c'est nous que nous paramétrons, c'est notre face qui est interface.
La puissance impotente.
Au plus près de notre corps ou déclenchées par un mouvement de celui-ci, ces interfaces nous renvoient l'image de notre (supposée) toute puissance alors qu'elles fabriquent pour l'essentiel des impotences. Les super-héros de notre enfance ont toujours eu des super-pouvoirs associés à chaque partie de leur corps. Et c'est souvent à partir de l'expression de leur visage que se déclenchent des apocalypses de toute puissance, à commencer bien sûr par leurs yeux : le laser de Superman fronçant les sourcils pour le déclencher (on le suppose sen tout cas), celui de Cyclope dans les X-Men, mais on pourrait aussi citer le souffle ou le cri sonique de toute une autre catégorie de super-héros. Le déclenchement à distance d'une action, c'est à dire la définition brute de l'interface, est aussi l'apanage des héros de notre enfance, tout comme la micro-gestuelle capable de déclencher l'apocalypse (ou de sortir notre héros de situations semblant désespérées). Citons aussi les mouvements de magie de Docteur Strange qui font écho aux manipulations de John Anderton (Tom Cruise) dans Minority Report …
Vision thermique de Superman. On ne sait pas trop comment elle se déclenche …
mais on observe qu'à chaque fois il fronce les sourcils :-)
Interface du lanceur de toile de Spiderman.
Gestuelle combinant doigt et cassure du poignet.
Interface de déclenchement de la visière laser de Cyclope (X-Men)
Gestuelle du doigt actionnant un bouton qui finira par être intégré au poignet comme Spiderman.
Interface vers d'autres mondes et réalités chez Docteur Strange.
Gestuelle de différents mouvements combinés des deux mains.
Interface de manipulation de documents à l'aide de gants haptiques.
Tom Cruise dans l'adaptation cinématographique de Minority Report de Phillip K. Dick.
Bref, les interfaces au plus près du corps ou en fonctionnalisant une partie (comme pour la navigation faciale) sont aussi habitées d'un imaginaire de capacitation capable de transcender nos vies à moindre coût. Ces interfaces nouvelles se présentent toujours avec une fonction de gain. Elle nous disent – les sociétés qui les produisent et les mettent en oeuvre – que nous allons gagner quelque chose. Mais qu'y gagnons-nous réellement ?
Voici ce que raconte Michel Serres quand il évoque le cours de son "maître" Leroy-Gourhan décrivant le moment où l'être humain s'était redressé sur ses deux pieds (à partir de 7'13) :
"les membres antérieurs ont perdu la fonction de portage mais par rapport aux sabots du cheval ou à la pince du crabe, ou aux organes terminaux des membres antérieurs des animaux, on a inventé la main. C'est un outil universel. Elle ne sert à rien la main, elle ne sert pas à une fonction, elle sert à tout. C'est un outil universel. On a perdu quelque chose de formaté on découvre de l'universel.
Oui mais à l'époque où nous étions quadrupèdes, la bouche avait fonction de préhension, elle attrapait de quoi manger, elle attrapait ses proies. Mais dès que la main apparaît, la bouche perd sa fonction de préhension, c'est la main qui en est chargée. La bouche a perdu la fonction de préhension mais elle devient un outil universel : elle parle. Et avec la parole on peut dire n'importe quoi. Parce que nous avons perdu des fonctions données, alors nous avons gagné des outils universels."
Une large part des interfaces contemporaines, à commencer par cette navigation faciale, sont un (micro) retour en arrière anthropologique dans lequel il ne s'agit plus de tendre vers un universel mais de rétablir des fonctions formatées, dont celle de la préhension sur des objets numériques ou virtuels.
Coup de Poker (Face).
Sans préjuger de la manière dont se développera cette navigation faciale, nous sommes – me semble-t-il – sur une pente dangereuse qui procède d'un double enfermement : celui de nos navigations qui deviennent carcérales (lire ma tribune sur Le Monde il y a … plus de 10 ans, et sa version longue sur Affordance) et celui d'un enfermement de nos modalités expressives par un effet de rationalisation qui est une ratiocination.
Navigation faciale. Naviguer par le visage. Alors allons-y.
Naviguons.
> Sélectionner un élément.
> Aller à l'élément suivant.
> Retourner à l'élément précédent
One More Thing …
En 2009, il y a donc une éternité numérique, le navigateur web Opéra, annonçait déjà avoir développé une application de navigation faciale. Il l'illustrait dans un article sur son site officiel (aujourd'hui accessible via la Wayback Machine). On y trouvait détaillées les différentes expressions du visage permettant donc de naviguer sur le web.
On y trouvait aussi une remarquable vidéo faisant la démonstration de cette technologie tout à fait … disruptive.
Tout était déjà là. Dès 2009. A ceci près qu'il s'agissait du 1er Avril 2009. Et que la navigation faciale était alors … un poisson d'avril et une vaste blague. Je vous conseille vraiment l'article, il est très drôle, notamment les "précisions" apportées pour la navigation faciale sur des sites pornos et des transactions bancaires 😉
Et le fait que cette blague de 2009 soit devenue un projet … réel de 2021 en dit assez peu sur l'évolution de l'humour … mais énormément sur notre tolérance au Bullshit, sur l'évolution des logiques systémiques de contrôle des corps, et sur l'acceptation sociale de formes évidentes de contraintes chaque fois présentées comme autant de possibilités d'émancipation.