Sommes nous prêts ?
Voici donc Sophia. "La sagesse" en grec. Sophia est développée par la société Hanson Robotics et a été "activée" pour la 1ère fois le 19 avril 2015. Sa peau est d'un silicone troublant, elle est capable de (re)produire plus de 62 expressions faciales, elle a des caméras à la place des yeux, et tout un tas d'algorithmes qui lui permettent de "voir", de nous reconnaître, de nous suivre du regard pendant une conversation et plein d'autres trucs. Sophia est réellement fascinante. Et totalement flippante.
Il y a toujours eu 2 aspects dans notre perception de la robotique et des robots : la robotique … et les robots. La robotique c'est l'ingénierie "cachée". Le robot c'est l'incarnation d'une ingénierie qui semble penser.
Plus les mois passent et plus cette question de l'ingénierie robotique devient sensible et clivante. Même en laissant de côté les fantasmes du transhumanisme et la réalité de l'homme augmenté (qui s'inscrit d'abord, rappelons-le, dans le tropisme ou le déterminisme historique de l'homme diminué), ces derniers jours ont été riches en annonces.
Google : une victoire et deux défaites d'image.
D'abord bien sûr il y a eu la victoire de la machine et du "deep learning" au jeu de Go. Oubliant peut-être un peu rapidement que cette victoire était celle d'un autre homme, et qu'AlphaGo n'a gagné que dans la mesure où il est possible de vaincre sans éprouver de sentiment de victoire (ou de défaite).
Avant cela il y eut tout le pataquès que suscita le premier accident dont la Google Car est "responsable" (dont je vous reparlerai dans un prochain billet).
Et il y a quelques semaines c'était Atlas, dernier né de la société Boston Dynamics, propriété de Google, dont on pouvait mesurer les progrès dans une vidéo. Las, dans la même vidéo (à partir de 1'27), pour prouver sa capacité d'adaptabilité à des situations réelles, on voyait aussi un homme frapper et repousser Atlas à l'aide d'une crosse de Hockey. Ou comme l'a titré Mashable, "Un abruti d'humain en train de battre un robot Boston Dynamics".
Cette vidéo demeurera historique. Pour au moins 3 raisons : scientifiquement d'abord parce que les progrès en termes d'adaptabilité au terrain sont vertigineux si on compare à d'autres vidéos de Boston Dynamics datant d'à peine 2 ans, symboliquement ensuite parce que c'est la première fois que l'on voit un homme "bousculer" un robot, économiquement enfin parce que ce sont précisément les réactions très "hostiles" qu'a suscité ladite vidéo qui ont achevé de convaincre Google de se séparer de Boston Dynamics.
Comme le rappelle très bien Numerama, 3 facteurs sont à l'origine de cette décision : officiellement, "le marché n'est pas prêt", ou en tout cas il n'y aurait pas de rentabilité à court terme pour ces développements robotiques. Officieusement, de nombreuses dissensions ont lieu entre les équipes de Google (l'unité Replicant) et celles de Boston Dynamics. Et enfin (et surtout …) :
"les équipes marketing d’Alphabet craignent désormais que la réputation du groupe ne soit entachée par ces robots humanoïdes inquiétants, développés par l’entreprise. « Il y a de l’excitation dans la presse tech, mais nous commençons aussi à voir des messages négatifs sur le fait que c’est terrifiant, prêt à prendre le travail des humains », s’est alarmé une directrice de la communication de Google, Courtney Hohne, dans un e-mail interne obtenu par Bloomberg. Elle a demandé à Google X de ne pas communiquer, après la diffusion de la vidéo d’Atlas. « Nous n’allons pas commenter cette vidéo, parce qu’il n’y a rien que l’on puisse vraiment ajouter, et nous ne voulons pas répondre à la plupart des questions qu’elle soulève »."
Naturellement, l'argument sur la rentabilité ou l'offre commerciale à court terme est du pur #bullshit. Il va d'ailleurs très probablement faire le bonheur de Toyota ou plus certainement d'Amazon, déjà sur les rangs pour le rachat, et qui n'en espérait probablement pas tant pour accélérer encore l'automatisation de ses process. Ce qui pose d'ailleurs le problème suivant : pourquoi Amazon (si tant est qu'il parvienne à racheter Boston Dynamics) ne serait-il pas confronté au même problème d'image et aux mêmes craintes que la directrice de la communication de chez Google ?? Et bien tout simplement parce qu'Amazon est d'abord (perçue comme) une chaîne industrielle désincarnée ; elle a d'ailleurs construit sa renommée, son image, sur cette course à la désincarnation, sur ces automatismes qui depuis quelques années seulement, commencent à être régulièrement pointés du doigt au regard des modes de management qu'ils induisent sur les quelques "humains" travaillant encore pour l'enseigne. Alors que Google, enfin Alphabet, dispose dans l'opinion d'une responsabilité sociétale de nature morale, responsabilité qu'elle a d'ailleurs elle-même contribué à forger en choisissant dès sa naissance le slogan "Don"t Be Evil" (opportunément remplacé lors de la renaissance Alphabet par le plus neutre "Do The Right Thing").
Le contexte médiatique des derniers mois est complètement saturé par le discours sur les dangers de l'intelligence artificielle à la suite des célèbres déclarations de Stephen Hawking, Elon Musk et Bill Gates. Discours qui trouve un écho très fort dans le contexte économique et social d'un monde dans lequel le grand remplacement par la machine (exemplifié par le débat autour de "l'Uberisation") souffle sur les braises d'un Luddisme que l'on croyait éteint depuis le combat contre les métiers à tisser. Et dans le même temps, chaque mois voit un nouveau progrès significatif dans ce champ scientifique être franchi. Les assistants personnels sont partout (Siri, Cortana, OK Google, Alexa), les voitures autonomes débarquent sur nos routes, l'intelligence artificielle et l'apprentissage profond battent par 4 manches à 1 le champion du monde d'un jeu réputé "incalculable" et nécessitant de l'intuition. Quand les hérauts de la techno-science se mettent à devenir les chantres d'un discours techno-critique à tendance apocalyptique assumée, le cadre de perception sociétal de ces problématiques se déplace et change d'angle, a fortiori quand le terrain de l'emploi est une chambre d'écho favorable à nombre de corrélations d'ailleurs souvent présentées à tort comme autant de causalités.
Dans le même temps, les enjeux de l'intelligence artificielle ou "assistée" sont aujourd'hui tellement cruciaux (en terme de marché comme d'image), et nous sommes à un tel moment historique de bascule que Google, sur ce sujet, ne peut en aucun cas se permettre une crise médiatique dans laquelle il se trouverait définitivement associé au côté obscur de l'IA, laissant à ses concurrents toute la place pour une IA conviviale et user-friendly. Donc il se sépare de Boston Dynamics à peine 3 ans après son rachat et malgré des progrès hallucinants sur le plan technologique.
La séquence historique est inédite : 23 février 2016, une vidéo montre un homme "maltraitant" un robot anthropomorphe ; 15 Mars 2016, un programme informatique sans visage ni corps bat un homme au jeu de Go.
Go comme le jeu. Go comme l'entame de Go-ogle. Go comme les G(iga)o(ctets) nécessaires à la programmation du mâle Alpha(Go).
Et le miroir se renverse en même temps qu'il se brise : nous pensions, nous imaginions, nous fantasmions les robots comme supérieurs physiquement : ils nous sont (pour le moment) nettement inférieurs ; nous pensions l'intelligence, l'apprentissage et l'intuition humaines supérieures aux capacités calculatoires de n'importe quel programme informatique, et l'homme s'incline pourtant.
Ce à quoi nous assistons est donc un logique et prévisible effet de décrochage entre la réalité des progrès technologiques d'une part, et le fantasme d'une hostilité robotique et d'une perte de contrôle de l'humain d'autre part, décrochage dans lequel on continue de chercher, au-delà de quelques trop rares initiatives privées, la constitution d'un champ de recherche entièrement dédié aux questions éthiques et sociales qui sont posées.
Nombreux sont en revanche les travaux (notamment en psychologie cognitive, en psychologie sociale ou en philosophie) qui étudient notre rapport aux robots en tant qu'interfaces. Même si, à la différence de Sophia, Atlas n'a pas de visage, il est une machine anthropomorphe, et lorsque que nous le voyons se faire ainsi bousculer par un individu (qui a eu le tort de ne pas revêtir l'icône de sa blouse blanche de chercheur pour dé-symboliser son action d'agression, et qui en plus ressemble davantage à Chuck Norris qu'à un gentil post-doctorant en robotique), nous voyons d'abord une action de maltraitance accomplie par un individu sur un avatar anthropomorphe plus "faible" que lui car moins autonome. Le mécanisme de transfert opère donc, comme dans les romans d'Asimov, et nous éprouvons au moins autant de l'empathie pour l'entité anthropomorphe bousculée que de l'hostilité pour l'entité biologique la bousculant.
<Incise> Ce n'est d'ailleurs probablement pas un hasard si l'un des robots les plus emblématiques, Nao, a la taille d'un enfant, perdant ainsi tout son potentiel "effrayant" et attirant plus spontanément l'empathie </incise>
Première moralité de cette histoire, la bataille de la robotique se jouera au moins autant sur le terrain de la recherche scientifique que sur celui de la communication et du storytelling associé, et ces deux terrains seront à leur tour largement pondérés par le contexte culturel dans lequel il prendront place. Pour s'en convaincre il n'est qu'à parcourir quelques articles sur la place et l'image qu'occupe la robotique et les robots au Japon, pays dans lequel on n'aurait jamais filmé Chuck Norris en train de latter un gentil robot pour nous montrer à quel point les robots s'améliorent … et pays dans lequel, plus sérieusement, les robots sont une alternative nécessaire à des besoins démographiques et socio-économiques qui permettent de légitimer le grand récit de la recherche en robotique et qui expliquent également l'avancée dont dispose ce pays en termes de recherche fondamentale et appliquée sur ces sujets.
<OK là en fait> je passe au sujet initial sur lequel je voulais faire ce billet, c'est à dire l'annonce du lancement par Facebook de son "Bot Store". Oui bon au début le lien n'est pas évident, mais courage, ce sera plus clair – enfin j'espère – à la fin de votre lecture. </OK là en fait>
Et pourtant elle parle !
Il y a – schématiquement – trois grandes manières d'interagir avec une machine, un programme, un robot. Physiquement d'abord : le cas Atlas. Intellectuellement ensuite : la victoire d'AlphaGo. Vocalement enfin, c'est à dire conversationnellement.
J'ai déjà beaucoup écrit sur cet aspect conversationnel et sur l'importance et la primauté actuelle et future de la voix comme interface : "La voix du web" en Mars 2012, "Il ne lui manquait plus que la parole" en Mai 2013, "D'après Elle de Spike Jonze" en Mars 2014 et "Alexa, Cortana, Siri, OK. La sinécure numérique" en Novembre 2014.
La thèse de ces 4 billets était que les interfaces vocales allaient devenir incontournables, notre première manière d'interagir avec l'information. Qu'elles s'incarneraient principalement dans le développement des "assistants intelligents". Qu'elles incarnaient un web "performatif", au service de l'action.
"la voix comme interface est d'abord celle de l'injonction ("trouve ceci", "cherche cela", "téléphone à mon dentiste"), de la convocation ("dis à Marie de me rejoindre au bureau")." Source.
Que leur fonction dialogique faisait face à l'immense défi de la compréhension du langage naturel, lequel était déjà pour l'essentiel résolu dans un certain nombre de situations de communication (fonction d'agenda, requêtes transactionnelles, traduction automatique, etc.). Que ces interfaces vocales présentent un intérêt stratégique pour le modèle de régie publicitaire qui structure aujourd'hui les grands écosystèmes du web (de Google à Facebook en passant par Apple) :
"parce que nous parler c'est nous éviter de lire ; parce que nous éviter de lire c'est nous éviter de comparer ; parce que nous éviter de comparer c'est nous éviter de choisir ; parce que nous éviter de choisir c'est pouvoir choisir à notre place." (Source)
Que ce retour à l'oralité est donc suspect à bien des égards, ou à tout le moins qu'il mérite d'être questionné :
"Nous gardions jusqu'ici deux avantages considérables sur les moteurs de "recherches" : celui de leur poser les questions que nous voulions, et celui d'être capable d'anticiper sinon sur les réponses, du moins sur la typologie des sites de réponses qu'ils nous fourniraient (un article de presse mais lequel ? une vidéo mais laquelle ? une page wikipédia mais laquelle ?). Le passage au stade oral enterre notre dernière capacité d'anticipation. Nous n'attendons plus rien de ces "recherches" parce que pour l'essentiel d'entre elles nous ne les "projettons" plus, parce que leur coût cognitif est nul et que sa satisfaction immédiate épuise l'idée même d'une projection pourtant toujours possible dans un processus de requêtage élaboré ou non déjà prescrit (Google Suggest). Et qu'il existe une corrélation claire entre le coût cognitif des requêtes et le coût transactionnel des réponses : plus le premier est faible, plus le second est élevé. Telle est la martingale du capitalisme cognitif des liens sponsorisés. Nous n'attendons plus rien de ces "requêtes" parce que nous les entendons. C'est entendu. Bien attendu. Bien entendu." (Source)
Que le débat sur "l'intelligence", artificielle ou assistée se pose désormais différemment :
"Au-delà de la tension permanente entre virtuel et réel, entre virtualisation (des relations sociales et amoureuses) et réalisation (de soi), la vraie question du film de Spike Jonze n'est pas de savoir si un "programme" peut devenir intelligent (imagerie classique de l'intelligence artificielle ou "assistée") mais de comprendre quels pourraient être les déclencheurs qui feraient que nous prêterions des capacités d'intelligence à un programme, à une interface. Ce qui est beaucoup plus probable, beaucoup plus troublant, beaucoup plus … malin." (Source)
Et qu'une lutte technologique était à l'oeuvre derrière la spécialisation de ces assistants intelligents, lutte qui se segmente pour l'instant comme suit :
"Apple was the strongest at productivity tasks like calendar appointments and email; Google was the best at travel and commute-related tasks. Alexa excelled at music, and Cortana was mediocre across the board."
Bot Store.
Le (remarquable) site d'actualité Quartz vient de lancer une fonctionnalité permettant non plus de lire mais bien de dialoguer, de discuter avec un automate qui envoie des alertes et répond par SMS à vos questions sur l'actualité en vous renvoyant in fine sur les articles concernés. L'expérience est vraiment aussi troublante que convaincante tant on a (un peu) l'impression de discuter en mode badin avec un journaliste qui répondrait à nos questions les plus évidentes sur le sujet de l'article qu'il vient d'écrire pour ensuite nous renvoyer – si nous le souhaitons – à la lecture dudit article. L'effet de sollicitation fonctionne parfaitement. Pour l'instant les réponses proposées à l'utilisateur sont stéréotypiques (= elles lui sont proposées et il n'est pas libre de taper ce qu'il veut), mais l'étape suivante devrait être franchie prochainement et l'expérience utilisateur est déjà relativement bluffante.
Un newsfeed dialogique. On savait les bots déjà capables d'écrire des articles, on les savait à l'origine de diverses ingénieries de recommandation de lecture et de consultation, voilà qu'ils sont maintenant capables de nous "raconter" les articles écrits et d'en assurer le service après-vente conversationnel.
Imaginez maintenant une sorte d'Apple Store depuis lequel, via votre application de Chat favorite vous seriez en capacité de choisir et d'installer le "bot", le robot, le programme conversationnel de l'ensemble de vos marques, produits et services favoris. Imaginez que l'essentiel de vos interactions, qui s'effectuaient jadis principalement au travers de requêtes adressées à un moteur de recherche ou d'applications dédiées, soient désormais autant de conversations avec le robot de telle ou telle marque, de telle ou telle entreprise. Bien sûr cela existe déjà en partie : la SNCF, la Poste (pour ne prendre que quelques entreprises françaises) ont déjà des "chat-bots" capables d'interagir avec les clients dans un certain nombre de situation portant sur les questions les plus courantes adressées à ces services. Hé bien justement …
Justement, LA nouvelle sur laquelle toute la presse tech spécule actuellement (TechCrunch en tête) est le lancement plus que probable par Facebook d'un "Bot Store" lors de sa conférence F8 du 16 Avril prochain. Késako un "Bot Store" ? Une boutique permettant aux marques de proposer des robots pour servir directement leurs clients. La révolution pourrait être encore plus importante que celle de l'App Store. D'abord par le nombre : 800 millions d'utilisateurs (de Messenger) seraient directement touchés par cette annonce. Ensuite par l'enjeu économique : "l'intelligence artificielle", du moins dans sa "triviale" dimension conversationnelle, va effectivement "changer le business sur Internet". Enfin par le "business model" à la fois disruptif (par son effet d'échelle) et pourtant paradoxalement déjà profondément inscrit dans nos habitus (cf l'effet de sollicitation susmentionné, qui mobilise toute l'habileté des écosystèmes de notification).
Les "bots" sont la prochaine révolution de l'internet, en train de vivre leur ruée vers l'or ("The Great Bot Rush"). Une révolution naturellement présentée par certains sous son côté sombre ("The Coming A.I. Botageddon"), mais une révolution indiscutable. Et le "Bot Store" de Facebook pourrait être leur nouveau paradigme.
BUA. Bot Uber Alles.
Révolution indiscutable parce que même si certains "bots" sont ceux de la bêtise, des bots non pas de l'intelligence mais de la bêtise artificielle, ces bots :
- représentent déjà 31% du trafic total sur le web,
- représentent plus de 8% des twittos,
- s'occupent de l'essentiel des modifications et corrections sur Wikipédia
- sont des journalistes qui ne dorment jamais,
- sont la première source d'activité et de trafic sur le web. "À la fin de cette décennie, les bots seront plus nombreux que les êtres humains. À la fin de la prochaine décennie, ils seront plus nombreux que nous dans une proportion de un pour 1.000.000. Ils seront partout. Dans chaque système, dans chaque maison, dans chaque objet." (Source)
- sont aussi bien journalistes, qu'encyclopédistes, que secrétaires de rédaction
Révolution en quête de modèle également, car pour l'instant trop dispersée à l'échelle d'un internet marchand qui ne pense plus qu'en termes de concentration. D'où les efforts de chaque géant de l'internet pour disposer de son "supra-bot" : M pour Facebook, OK Google pour Google, Cortana pour Microsoft, Siri pour Apple, Alexa pour Amazon.
La vallée de l'étrange chambre chinoise.
La vallée de l'étrange c'est ça :
"La notion de « vallée de l’étrange » (Uncanny Valley), inventée dans les années 1970 par le roboticien Masahiro Mori, désigne le fait que, lorsqu’un objet atteint un certain degré de ressemblance anthropomorphique apparaît une sensation d’angoisse et de malaise. Et cela que l’objet soit un robot androïde, une prothèse ou une marionnette. Ce phénomène peut être représenté par un graphique où les ordonnées représentent la familiarité (ou la sympathie) et l’abscisse, le degré d’anthropomorphisme. On parle ici de vallée car, au-delà d’un certain niveau de perfection dans l’imitation, les objets androïdes sont de mieux en mieux acceptés."
Et la chambre chinoise c'est ça :
"Le terme de chambre chinoise désigne une expérience de pensée imaginée par John Searle vers 19801. Searle se demandait si un programme informatique, si complexe soit-il, serait suffisant pour donner un esprit à un système. Cette expérience de pensée vise à montrer qu'une intelligence artificielle ne peut être qu'une intelligence artificielle faible et ne peut que simuler une conscience, plutôt que de posséder des authentiques états mentaux de conscience et d'intentionnalité. (…)
Dans cette expérience de pensée, Searle imagine une personne qui n’a aucune connaissance du chinois (en l’occurrence, lui-même) enfermée dans une chambre. On met à disposition de cette personne un catalogue de règles permettant de répondre à des phrases en chinois. Ces règles sont parfaitement claires pour l'opérateur. Leur application se base uniquement sur la syntaxe des phrases. Une phrase d’une certaine forme syntaxique en chinois est corrélée avec une phrase d’une autre forme syntaxique. L'opérateur enfermé dans la chambre reçoit donc des phrases écrites en chinois et, en appliquant les règles qu’il a à sa disposition, il produit d’autres phrases en chinois qui constituent en fait des réponses à des questions posées par un vrai sinophone situé à l’extérieur de la chambre. Du point de vue du locuteur qui pose les questions, la personne enfermée dans la chambre se comporte comme un individu qui parlerait vraiment chinois. Mais, en l’occurrence, cette dernière n’a aucune compréhension de la signification des phrases en chinois qu’elle transforme. Elle ne fait que suivre des règles prédéterminées.
En poursuivant ironiquement la procédure du test de Turing, test censé démontrer qu'un programme informatique sophistiqué peut être qualifié d'intelligent, Searle imagine que le programme déterminant les réponses qui sont données à l'interlocuteur sinophone devient si sophistiqué, et la personne non sinophone qui répond aux questions devient si habile dans la manipulation des symboles, qu'à la fin de l'expérience, les réponses qu'elle donne aux questions ne peuvent être distinguées de celles que donnerait un vrai locuteur chinois de langue maternelle, bien que selon Searle, la personne qu'on imagine enfermée dans la chambre, ne comprenne toujours pas un mot de chinois.
Cette expérience de pensée montre qu'il ne suffit pas d'être capable de reproduire exactement les comportements linguistiques d'un locuteur chinois pour parler chinois, car parler le chinois, ou n'importe quelle autre langue, ce n'est pas juste dire les bonnes choses au bon moment, c'est aussi signifier ou vouloir dire ce qu'on dit : un usage maîtrisé du langage se double ainsi d'une conscience du sens de ce qu'on dit (conscience intentionnelle) et la reproduction artificielle, même parfaite, d'un comportement linguistique ne suffit pas à produire une telle conscience."
Donc pour résumer (et conclure) rapidement : si AlphaGo est bien dans la chambre chinoise du raisonnement, Atlas est lui dans la vallée de l'étrange de l'anthropomorphisme. Et le "Bot Store" de Facebook pourrait – momentanément – tirer parti du meilleur des deux mondes en étant la solution la plus "en phase" avec notre niveau d'attente (et notre capacité de rejet) de ces technologies automates : les "bots" disponibles sont capables d'imiter, sinon un raisonnement, du moins un arbre de décisions assez court et suffisamment prévisible pour qu'il paraisse conversationnellement fluide et se rapproche du sentiment d'une interaction "humaine", et les mêmes bots n'auront pas à se poser la question de leur situation dans la vallée de l'étrange puisqu'il ne sont pas incarnés autrement qu'au travers de messages textes et/ou d'interfaces vocales sans visage ni corps.
En attendant de voir qui de Sophia, d'Atlas, d'AlphaGo ou d'un quelconque Bot vocal sera le premier à sortir de la vallée de l'étrange ou de sa chambre chinoise. Ou en attendant Go… dot.
"Ce qui est certain, c'est que le temps est long, dans ces conditions, et nous pousse à le meubler d'agissements qui, comment dire, qui peuvent à première vue paraître raisonnables, mais dont nous avons l'habitude. Tu me diras que c'est pour empêcher notre raison de sombrer. C'est une affaire entendue. Mais n'erre-t-elle pas déjà dans la nuit permanente des grands fonds, voilà ce que je me demande parfois."
Samuel Beckett. En Attendant Godot.