Voilà bien longtemps que l’on n’avait plus reparlé de la taille du web. S’étant probablement apreçu qu’en ce domaine comme en d’autres ce n’est pas (que ?) la taille qui compte. Surtout qu’en ce domaine, elle – la taille – confine à l’incommensurable. Pourtant, d’acharnés chercheurs cherchent encore. De son côté le magazine Pandia nous rappelle quelques chiffres issus de différentes études (dont on retrouvera les références sous le lien) :
- 2000 : 7 millions de sites (soit 50 % de plus qu’en 1999)
- 2005 : 11,5 milliards de pages.
- 2005 : Yahoo! annonce 19,2 milliards de documents dans son index.
- Janvier 2007 : 433 millions (433 193 199 exactement …) de noms de domaine contredisant une autre étude indiquant de son côté 100 millions de noms de domaine dont moins de la moitié seraient "actifs".
- Février 2007 : 30 milliards de pages web.
- 2007 encore : 1 milliard d’internautes.
- … "et moi, et moi et moi …"
Pour mémoire, en 2003 et selon les chercheurs qui cherchent cités plus haut :
- le web "de surface" (= indexé ou susceptible de l’être par les moteurs) représente 167 TéraBits d’information
- les données des bibliothèques : 2,000 TB
- le web profond ("invisible" ou "deep web") : 91,850 TB
(Pour mémoire 1 TB = 1000 GigaBits)
De l’information, des données, des bits, des internautes, des pages web, profondes ou de surface, des sites, des documents, des noms de domaine … L’objet d’étude se noie dans la masse de ses descripteurs dont pourtant seul le croisement peut permettre d’en cerner les contours. L’immensité rhizomatique du monde et face à elle … nous. Etres humains singuliers bien que de plus en plus participatifs, dotés certes de moultes prothèses mémorielles externes (dont celle du disque sous l’écran qui nous donne accès à cette immensité) mais au final, nous, avec notre mémoire. Rapport de force ?
Notre mémoire … L’envie de la "mesurer" ne date pas d’aujourd’hui. Cet article "How many Bytes in human memory" date de 1988.
- si on compte les impulsions neuronales durant une vie entière, on arrive (environ) à 1020 bits
- si on mesure le nombre total de synapses et que l’on considère que chacune contient quelques bits, on arrive alors à 1013 à 1015 bits
- Voilà. Vous ferez vous-mêmes la conversion en térabits et aurez la gentillesse de la déposer en commentaires 🙂
Enfin, ce billet récent d’Accelerating Future, nous indique qu’en 1984, on avait estimé qu’un être humain pouvait "retenir" l’équivalent de 2 bits mémoriels par seconde. Vous multiplierez vous-même par le nombre de secondes d’une vie (et là, inutile de laisser le résultat en commentaire). D’où l’idée (qui a dit "saugrenue" ?) de compter le nombre de bits mémoire par individu et de multiplier par le nombre d’individus ayant peuplé cette planète depuis l’arrivée de l’homo sapiens (50 000 ans avant JC). Ce qui donne : 107 terabytes, soit près de 20 fois l’information générée par Internet en 2002 selon les chercheurs qui cherchent.
Moralité 1 : d’après de savants et légèrement capilo-tractés calculs, l’humanité a mis 521 siècles pour emmagasiner ou produire l’équivalent de l’information produite en moins de 10 ans par Internet et la numérisation. Ce qui donne quand même un ordre d’idée intéressant et terme d’archivistique numérique :-))
Moralité 2 : quand on veut compter, on peut toujours 🙂
Moralité 3 : celle de Tim Berners Lee : "People have, since it started, complained about the fact that there is
junk on the web. And as a universal medium, of course, it is important
that the web itself doesn’t try to decide what is publishable. The way
quality works on the web is through links."
Update : Illustrations sur ce thème et quelques autres chiffres chez Francis Pisani, à partir de l’étude IDC baptisée "Digital Universe", étude relevée et également commentée par l’Atelier.
10^13 bits = 10 Terabits
10^15 bits = 1000 Terabits
Petite note sur le dernier paragraphe : 1 bit = 8 bytes.
Sinon, prems !
une bonne histoire que je racconte à mes petits n’élèves de seconde quand je dois leur parler du web :
“je bois un litre d’eau par jour, je fais 5 km pour venir travailler, je pèse 😯 Kg, je mesure 1,80 m, Combien de megabyte est-ce que je consomme par jour ?
Nous avons changé de système de mesure. L’unité de mesure humaine, c’est le kilo, en passant au mega, nous passons à l’échelle de l’univers”
cf. http://richard.peirano.free.fr/wordpress/?p=123
Voilà qui n’est pas sans me rappeler la théorie du noeud papillon 🙂
http://adscriptum.blogspot.com/2006/01/importance-dune-stratgie-de-liens.html#2006/01/importance-dune-stratgie-de-liens.html#Papillon
Jean-Marie
Ce bon vieux web invisible ….
J’avais fait mes classes du Web invisible avec Jean-Piere Lardy , dont l’ADDNB a gardé trace. C’était autrefois, puisqu’en 2000, soit à la Préhistoire du Web.
Et voilà qu’Archimag consacre (a consacré) en septembre un bon dossier à cette thématique…