Le 23 Mars à San Francisco, dans sa "Cloud Developer Conference", Google a annoncé – en gros – qu'il allait déployer ses technologies de "machine learning" sur l'ensemble de son architecture Cloud et les services associés. L'article de Re/Code vous expliquera tout ça mieux que moi 🙂 Donc si vous êtes clients du Google Cloud vous bénéficierez, nativement, pour vos propres services, des technos "d'intelligence artificielle" les plus à la pointe du géant de Mountain View, dont l'outil – open source – d'IA connu sous le nom de "Tensor Flow". De quoi espérer distancer la concurrence :
"On the cloud side, Google’s intent is that machine intelligent features can distinguish its platform from those of larger rivals Amazon and Microsoft. Specifically, Google expanded its open source AI tool, TensorFlow, to its cloud platform and pitched a package of AI-infused APIs for enterprise customers. Those include Google’s computer systems for translating languages, recognizing speech and scanning an image (say, a cat) and detailing it immediately (this is the type of cat). (…) But Jeff Dean, Google’s machine learning guru, specified that the bigger impact is allowing businesses to deploy Google’s advanced data-churning methods** on their own models. “They can take their data and actually build insight,” he said on Wednesday." Recode.
** "Data-Churning" est relativement intraduisible mais (d'après mon collègue prof d'anglais) l'idée de "churning" renvoie au "brassage", à l'action de mélanger. Les "data-churning methods" seraient donc des méthodes de "brassage de données".
Et nous voilà propulsés dans le 3ème âge du Cloud.
Petit rappel historique. Comme je l'écrivais ici il y a déjà 5 ans :
"le concept de cloud computing en tant qu'informatique distribuée est relativement ancien (années 1990, en fait on pourrait même remonter aux premiers réseaux genre Arpanet mais bon, c'est pas le sujet). Sa première formalisation dans son acception actuelle (données "personnelles" stockées en ligne) date de 1997, mais son émergence "grand public" n'arrive que 10 ans plus tard, au cours de l'année 2007 – Amazon Web Service, grand ancêtre du Cloud, est lancé en 2006 -, en même temps que l'externalisation du stockage des données personnelles entre dans sa phase industrielle et industrieuse."
Donc après le Cloud des services, après celui du stockage de données dans sa phase industrielle "Big Data", voici le Cloud des "algos" et du "machine learning".
Une phase somme toute "logique" puisque ce que l'on nomme "Cloud" n'est, très prosaïquement rien d'autre que "l'ordinateur de quelqu'un d'autre", et plus globalement, une industrie lourde (à partir de la diapo 47) très loin de l'image vaporeuse et légère associée au vocable qui la désigne en l'euphémisant (le "nuage").
Mais il est également intéressant de noter que le "Cloud" a eu une construction historique très différente de celle du web qui agrège pourtant également des services, des données et des algorithmes. Sur le web, les données préexistent et sont naturellement, presque "ontologiquement", décentralisées. Sur ces données (des pages de texte au départ) viennent se greffer des algorithmes (au départ très basiques) à partir desquels il est possible (pour les détenteurs desdits algos et plus difficilement déjà pour les détenteurs desdites données) et proposer des services.
Donc le web c'est : 1. Des données > 2. Des algos > 3. Des services
Alors que le Cloud s'est d'abord construit sur des services (centralisés) qui ont servi d'appeau à une migration (et à une centralisation) industrielle des données, sur lesquels on vient maintenant faire tourner des algos.
Donc le Cloud c'est : 1. Des services > 2. Des données > 3 Des algos
L'âge du nuage.
Mais revenons donc à ces 3 âges du Cloud pour tenter de mieux les caractériser.
Le tableau me semble suffisamment descriptif pour ne pas avoir besoin de le commenter davantage (enfin j'espère), mais après l'avoir construit je me suis souvenu de l'argumentaire de Google à l'époque du lancement de Google Drive autour de ce qu'il appelait la "Golden Copy", la "copie dorée" :
"En nous rapprochant de la réalité d'un "stockage à 100%", la copie en ligne de vos données deviendra votre copie dorée et les copies sur vos machines locales feront davantage fonction de cache. L'une des implications importantes de ce changement est que nous devons rendre votre copie en ligne encore plus sûre que si elle était sur votre propre machine."
Le 1er âge du Cloud avait pour ambition de permettre aux entreprises de disposer de "services en or" au double sens du terme : c'est à dire assez (voire très) onéreux et/mais permettant de bénéficier de l'énorme architecture technico (serveurs) logistique (API) d'Amazon.
Le 2ème âge du Cloud, lui, ciblait donc la "golden copy" de nos données personnelles tout autant que celles des biens de consommation dématérialisés (films, musique, livres, etc …)
Le 3ème âge du Cloud avec le déploiement et la mise à disposition de technologies relevant du Machine Learning semble pour l'instant viser un autre âge d'or, celui de services sémantiques (ou sémantisés) et conversationnels relativement autonomes et auto-apprenants. On soulignera bien sûr que nous ne sommes qu'au tout début de ces services et très loin d'assistants ou de bots conversationnels réellement capables d'une autre forme d'intelligence que celle, étymologique, qui leur permet de "créer et d'établir des liens". Mais on se souviendra aussi qu'il y a 10 ans, en 2005, un type écrivait dans un article du Monde :
"Qu'adviendrait-il si nous n'avions plus le choix ? Si les disques durs disparaissaient au profit d'espaces et de services d'information exclusivement "en ligne" ?"
Lucy in the Sky with Diamonds.
Si le web ou l'internet 3.0 est à chercher quelque part, c'est probablement autant du côté de la sémantique et des assistants intelligents que de celui de ce Cloud de troisième génération.
Et avec lui s'annonce un changement de paradigme assez radical : ce ne sont plus des données qui permettent à des algorithmes de fournir un certain nombre de services (ça c'était le web), mais des algorithmes capables d'apprendre et d'utiliser de manière (pour l'instant) relativement autonome d'immenses jeux de données (Big Data) pour produire des services la plupart du temps "automatisés".
"Lucy in the sky with diamonds". Et maintenant "Algos in the Cloud with Machine Learning." D'un château psychotrope l'autre. Des algos sous acide. Et qui rêvent. Algo-trip in the Cloud.
Golden copy est plutôt dérivé de l’idée de gold standard, autrement dit la copie de référence