Nous y sommes donc enfin. A l'ère de la traduction automatique instantanée, "à la volée". Les projets étaient dans les cartons depuis plusieurs années, les premières démonstrations et versions béta convaincantes viennent de sortir.
Skype Translator.
De côté de Microsoft et Skype on a donc le "skype translator" qui permet à deux locuteurs s'exprimant dans des langues différentes d'échanger en quasi-direct (autour de phrases tout de même assez routinières et conversationnelles). L'espagnol et l'anglais (les deux langues les plus parlées sur la planète, à l'exception du chinoins naturellement) sont pour l'instant disponibles en version "orale" et la traduction instantanée de plus de 40 langues est apparemment (je n'ai pas testé) proposée pour les échanges écrits par messagerie instantanée. Naturellement, mais pas uniquement dans un souci marketing, c'est d'abord auprès d'écoliers que le dispositif a été testé comme l'indique le billet de blog annonçant la nouvelle.
Google World Lens.
L'autre annonce nous vient du côté de chez Google, avec l'arrivée d'une mise à jour de l'application "Google Translate", qui gère déjà, à l'écrit, plus de 90 langues, et qui permet désormais la traduction visuelle "à la volée" grâce à "World Lens". L'exemple avait déjà été signalé comme une fonctionnalité prometteuse des Google Glasses. Le voici (l'exemple) :
Menus dans les retaurants mais aussi plans, panneaux de signalisation, la traduction visuelle en temps-réel, "à la demande", du quotidien.
Kids créole.
La place de l'anglais comme "langue de communication internationale" se double désormais – au moins chez Google – par son statut de "langue pivot". On pourrait a priori penser que cette multiplication des possibilités d'échanger "dans la langue natale" va précisément faire reculer le "WallStreet English" alors que c'est très exactement l'inverse qui risque de se produire mais de manière beaucoup plus insidieuse et avec des implications bien plus étendues. Que l'anglais serve en effet de langue pivot pour assurer l'essentiel des traductions instantanées (langue 1 => anglais => langue 2) pose la question non pas de LA "diversité linguistique" mais celle, bien plus troublante, DES diversités grammaticales, syntaxiques et lexicologiques. L'article incontournable sur le sujet de ces futurs "lost in translation" est signé de Frédéric Kaplan : "L'anglais comme langue pivot ou l'impérialisme linguistique caché de Google Translate" :
"Il est normal que Google Translate procède de cette façon. Pour produire un traducteur automatique, il est nécessaire de disposer de grand corpus de textes identiques traduits d’une langue à l’autre. Google étant une entreprise américaine, son outil s’est construit sur des paires associant presque toujours l’anglais comme langue pivot.
Le biais culturel d’un tel procédé est évidemment important. Le Français et l’Italien sont des langues relativement proches. En comparaison, l’anglais est une langue particulière, compacte, idiomatique. Projeter vers l’espace anglophone puis reprojeter vers une langue cible induit des effets linguistiques et culturels qu’il faut étudier.
(…) Les modèles ainsi induits peuvent dans un second temps être utilisés par des services de médiation textuelle qui proposent par exemple d’autocompléter une phrase que vous êtes en train de taper. Il n’est pas un impensable que, dans quelque temps, un italien commençant une phrase par “Piove …” se voit proposer la continuation “Piove cani e gatti”, une expression qui sans doute n’a jamais été prononcée ou écrite dans toute l’histoire de la langue italienne. Le pivot linguistique vers l’anglais participe à un phénomène de créolisation inédit.
L’impérialisme linguistique de l’anglais a donc des effets beaucoup plus subtils que ne le laisseraient penser les approches qui n’étudient que la “guerre des langues”. Le fait de pivoter par une langue conduit à introduire dans les autres langues des logiques linguistiques propres et donc insensiblement des modes de pensée spécifiques. Il semble crucial d’inventer de nouveaux outils pour détecter et documenter ces nouvelles évolutions linguistiques."
Hey Teachers, leave them kids alone.
L'enseignement des langues à l'école va naturellement subir de plein fouet ces nouveaux standards d'usage (déjà que Google Translate est le meilleur ami de tous les collégiens et lycéens et étudiants de France et d'ailleurs …). Pas un hasard si la campagne marketing de Microsoft a bien pris soin de faire tester le nouveau Skype auprès d'un public de jeunes enfants.
Vous n'entendez plus que ma voix.
J'ai déjà écrit plusieurs billets sur la place qu'était amenée à occuper la parole et les interfaces dites "vocales" dans notre accès à l'information, avec le recul de l'écrit que cela occasionnait. Or pour que la voix devienne une interface universelle, il lui faut être capable de s'abstraire des régimes linguistiques particuliers.
Le rythme et l'algorithme. Le flow et le flux.
Le numérique est un support profondément, nativement, naturellement et intrinsèquement mémoriel. Quels que soient les données et leur mode d'entrée, qu'il s'agisse de textes, d'images, de sons, de vidéos, de conversations, tout peut être à tout moment reconvoqué, rappelé. Recall. Total Recall. Silico Transit Memoria Mundi. Si la question de l'engrammation de la parole est plus pregnante et plus problématique que celle de l'écrit ou des productions (images, vidéos) nécessitant et offrant la possibilité d'une distance, d'un retour en arrière, d'un laps de temps qui est celui de la publication et pendant lequel tous les retour en arrière sont encore possibles, c'est que la parole, la conversation, ne relève pas de ce processus de publication. La voix, la parole, la conversation, sont les seules modalités d'un rendu public sans publication. Le rythme de la parole, dans sa dimension conversationnelle, est a-publiable ("a" privatif). Or nous voyons aujourd'hui se substituer à ce rythme a-publiable, des algorithmes de publication et de republication de la parole. Bien plus que de simples (mais essentielles) questions de surveillance – le possible permanent rappel (recall) de la moindre bribe conversationnelle -, cette substitution pose la question du rapport que nous serons demain capables d'entretenir avec l'instantané, avec le non-technologiquement médié, avec le non-algorithmiquement calculable, avec le non-calculé.
Babel Ouèbe.
Dans l'histoire de la tour de Babel, les hommes cherchaient à atteindre Dieu, qui pour les en empêcher leur envoya donc la diversité linguistique, et vas-y que le maçon irlandais ne comprit plus les instructions du platrier yougoslave, lui-même devenu sourd aux injonctions de l'électricien polonais, fin de chantier, pour le grand architecte, vous repasserez.
Il y aura bien sûr toujours des "locuteurs natifs" de telle ou telle langue. Mais les robots ? Les "bots" ? Quelle est leur langue maternelle ? En auront-ils une un jour ? Ces "bots" qui sont aujourd'hui journalistes, encyclopédistes, secrétaires de rédaction, qui représentent plus de 8% des twittos, qui dans 15 ans seront plus nombreux que nous (les humains) dans une proportion de 1 pour 1 000 000, ces robots qui représentent déjà 31% du trafic total sur le web, quelle langue parleront-ils ? Peut-on imaginer un "bot" wikipédia allemand discuter en anglais avec un "bot" wikipédia espagnol via Google Translate ou Skype Translator sur la traduction automatique d'une page allemande dans sa version espagnole et sur les tournures les plus adaptées ?
La technologie, les technologies de traduction instantanée n'abolissent pas les frontières linguistiques. Elles en créent d'autres. D'autres frontières aux douaniers de 0 et de 1, aux barrières de bits.
#Big Babil.
Dans ce Big Babil numérique, dans cette nouvelle mythologie numérique, ce sont des algorithmes et des (ro)bots qui sont en train de bâtir sous nos yeux un édifice du haut duquel ils pourraient un jour atteindre la forme d'intelligence que seule permet la maîtrise de la langue, la maîtrise de la parole. Des bots prédicateurs. Pré-dictateurs.
Vu le niveau de Google Translate,il y a encore un peu de marge. Mais pour combien de temps..?
J’y vois aussi un effet positif. En France on (les entreprises surtout)rechigne a allouer les moyens nécessaires à de la traduction, qui est un métier. Il suffit de voir le niveau de français des notices d’utilisation traduites de langues étrangères pour s’en rendre compte. Faute de volonté budgétaire, on fait traduire ça à la vas-y que-j’te-pousse par un salarié qui a pour toute compétence une semaine d’échange culturel au Royaume-Uni l’année de sa 5ème. Résultat catastrophique. Les bots vont peut être enfin relever ce niveau indigent. A défaut de sauver les métiers de la trad, on aura au moins des textes cohérents et intelligibles.
L’effet positif est bien sûr l’accès (direct) à l’information dans n’importe quelle langue. Ainsi, le passionné d’origami ou d’ikabana va pouvoir suivre des tutoriaux et des webinaires en direct avec des maîtres japonais.
L’aspect négatif, c’est qu’il va court-circuiter des métiers et des intermédiaires.
L’effet de bord, c’est qu’il va développer un attachement maladif à l’instantané et de moins en moins tolérer la « frustration » d’apprendre une langue, etc
Enfin, puisque les algos de IA sont développés par des scientifiques avec la bosse des maths, gageons que les corpus seront limités pour plus d’efficacité, et alors adieu richesse du vocabulaire, prose syntaxique et poésie grammaticale.