Impossible de faire l’impasse sur cette nouvelle d’importance. Et c’eût été dommage de la noyer dans le fatras des petits billets de rentrée … donc …
Cela fait déjà longtemps qu’on en parlait,
c’est désormais chose faite. Le dernier petit village gaulois résistant
encore et toujours au grand numérisateur d’outre-atlantique … ne
résiste plus. Google numérisera le fonds des 500 000 ouvrages de la BM de Lyon. Cela devrait lui prendre 10 ans. Voici quelques billets incontournables pour comprendre les enjeux de ce nouveau contrat : Alain Pierrot et BiblioFrance.
Je rappelle simplement qu’avec le retrait de Microsoft du marché de la
numérisation d’ouvrages libres de droits (arrêt du programme Live Book
Search) confortant la situation de monopole de Google (exception faite
de l’OCA qui n’a
cependant pas les mêmes finances et donc le même rythme de croisière ni
la même force de frappe), et avec les temps de disette culturelle qui
se confirment chaque jour davantage, la question d’une alternative
publique "crédible" ne méritera bientôt – hélas – même plus d’être posée. Faute
de grives … on pourra toujours s’occuper en relisant divers guides de bonnes pratiques pour une numérisation réussie …
Sur ce sujet, prenez également le temps de lire la réaction en forme de coup de gueule de Jean-Claude Guédon, postée sur Biblio-fr, dont je reproduis ici un (large) extrait et que je partage entièrement (cf mes nombreuses alertes à propos du risque d’un eugénisme documentaire):
- " (…)
La numérisation à la Google est un piège. En effet, le document
numérisé demeure la propriété de Google et la bibliothèque impliquée
doit empêcher tout autre moteur de recherche autre que Google d’indexer
sa collection numérisée. En d’autres mots, Lyon pourra consulter la
version indexée en interne, et ne pourra exposer au reste du monde que
du "papier numérique" (pages images). Il est vrai que nous aurons ainsi
accès à des milliers de livres rares, mais ces ouvrages ne seront
disponibles que sous la forme de pages-images que l’on ne pourra que
lire. Toute recherche plein texte devra s’effectuer par le truchement
du site de Google. Toute autre opération sur le texte sera impossible,
sauf à refaire le travail de reconnaissance des caractères. Bref, le
"cadeau" de Google, c’est un document numérique aussi proche du papier
que possible. (…) Ce que Google recherche actuellement, c’est
un monopole sur la capacité d’appliquer toute forme d’algorithmique à
la documentation numérique mondiale. En bref, Google veut devenir le
système d’exploitation de la documentation numérique et pourra ainsi contrôler toutes les opérations
de récupération, identification, analyses sémantiques, etc. que l’on
peut effectuer ou imaginer dans le monde numérique. Il y va de la
mémoire collective de tous les peuples; il y va aussi de l’accès à
l’information (et sa manipulation), etc. Bref, il y va de conséquences
fondamentales pour la culture et la vie politique mondiale. Bravo, Lyon
! Vous voilà complice d’un magnifique holdup culturel !
Une
alternative beaucoup plus intéressante aurait été L’Open Content
Alliance. C’est un peu moins efficace, un peu plus coûteux, et un peu
plus lent, mais c’est entièrement libre. Malheureusement, le mirage
d’une numérisation de masse rapide et gratuite conduit à ignorer ou
négliger les côtés plus subtils du cadeau empoisonné de Google. Google
a su produire une offre qui détient un réel pouvoir de fascination pour
certains bibliothécaires. C’est regrettable, mais cela révèle aussi les
limites de certains bibliothécaires, ceux qui jouent avec Google (comme
l’on joue avec le feu) : ce sont de parfait spécialistes des incunables
numériques et ils observent l’avenir dans leur rétroviseur (pour
reprendre une formule bien connue de Marshall McLuhan).
*Jean-Claude Guédon*
*Université de Montréal*
Je ne croie pas en revanche (je n’ai jamais cru), comme l’analyse Jean-Michel, que le livre soit une danseuse pour Google, une maîtresse que l’on (qu’il) entretient à fonds perdus. Et ce pour plusieurs raisons que je vais brièvement résumer :
- Primo, rien dans les pratiques de Google (corporate management) ne laisse place à la notion de "danseuse". Les fameux 20% de temps octroyés aux employés pour qu’ils travaillent sur des projets à eux n’ont de sens que dans la mesure où ils permettent de faire émerger des projets et des applications rentables pour la firme (Gmail, GoogleMaps …).
- Deuxio, en accord avec les arguments de Jean-Michel (mettre en place une barrière d’entrée suffisamment haute sur le marché de la numérisation de masse, s’attirer les faveurs d’une partie des intellectuels), le service GoogleBooks tient également une place de choix dans l’écosystème algorithmique de la firme : la base de connaissance ainsi constituée n’est probablement pas étrangère aux remarquables capacités de traduction automatique du même Google.
- Tertio, même si, comme le note encore Jean-Michel, l’arrivée de Google sur ce marché "n’a pas modifié l’économie du livre, ni celle des bibliothèques", elle a en revanche considérablement fait bouger les lignes. Elle a contraint l’ensemble des acteurs de la chaîne du livre (des éditeurs aux auteurs en passant par les libraires et les bibliothèques) à se (re-)positionner. Davantage encore, elle a pris une place à l’horizon du débat sur la numérisation de masse au regard de laquelle chacun doit placer ses pions et redéfinir ses stratégies dans un mouvement de jeu initié là encore par le même Google et son service GoogleBooks. L’impact sur l’économie du livre et des bibliothèques pourrait dès lors être tout à fait retentissant lorsque le marché de la lecture électronique (liseuses notamment) prendra son véritable essor.
Je pourrai lister d’autres arguments mais ce serait un peu long pour un billet de rentrée, donc je résume : une danseuse qui s’inscrit dans une stratégie globale de management, un danseuse dont les effets d’optimisation sur des services tiers sont certainement importants (d’aussi loin en tout cas que l’on puisse en juger), une danseuse qui modifie les postures et les stratégies d’un ensemble d’autres acteurs, d’individus et de corporations … ne me semble pas vraiment correspondre à la définition d’une danseuse 😉
Dans un monde ou la circulation, le flux, prennent chaque jour davantage le pas sur l’inscrit, sur le fixe, le service GoogleBooks, plutôt qu’un danseuse, pourrait rapidement s’avérer être une pièce maîtresse dans le jeu du contrôle de l’accès aux contenus et du formattage des pratiques afférentes.
Et puis encore … Repérés par Alain Pierrot, ces 3 articles du dernier congrès de l’IFLA dont celui consacré à l’accord de la bibliothèque de Bavière avec Google (.pdf) a retenu mon attention. Il n’offre aucun scoop mais livre une foule de détails intéressants, dont celui-ci :
- "la coopération entre Google et la BSB implique que, pour la première fois dans l’histoire des bibliothèques allemandes, un projet de numérisation à l’échelle industrielle soit planifié techniquement et logistiquement. Une "sélection" d’ouvrages est faite uniquement en fonction de leur état – et donc la capacité de ceux-ci à être scannés dans une perspective de conservation, et selon certaines exigences de taille et de volumes dues à la technologie de numérisation propriété de Google. (…) Il faut souligner dans ce contexte que le critère "conservation", sous-jacent à la décision de déclarer un ouvrage en état satisfaisant pour être numérisé ou non, a été décidé conjointement par la BSB et Google. En cas de doute, le verdict final est toujours rendu par la bibliothèque. (…) Les normes de qualité fixées en accord avec Google comprennent également une marge de manoeuvre, comme il est d’usage dans ce genre de projets financés par des fonds privés. La BSB a eu la chance de ne pas appartenir aux membres fondateurs de ce projet, lancé par Google en 2004, mais aux membres "tardifs", qui profitent aujourd’hui des ajustements technologiques continuellement apportés par Google."
Salut Olivier,
Plusieurs remarques.
J’ai employé le terme danseuse (pour le livre) en contrepoint à celui d’entraîneuse (pour la presse). Isolé, le terme prend une force qu’il n’avait pas dans mon esprit. L’idée était de montrer que l’on ne peut réduire la stratégie de Google à une seule logique. Si la firme a un cœur de métier, elle fait face à des partenaires/concurrents hétérogènes, dans leurs contraintes techniques et dans leurs modèles d’affaires, et c’est une erreur de croire que le pragmatisme de Google ne se décline pas différemment selon les branches de l’industrie documentaire. Google, par exemple, ne constitue pas un fond de presse. Les différences de stratégies sont tout aussi sensibles dans la relation avec l’audiovisuel ou encore sur les encyclopédies.
Par ailleurs, le contrat avec Lyon porte sur les livres anciens. Pour le moment, la qualité de la numérisation de Google ne permet pas de penser que sur ce type de livres la recherche plein texte sera d’une grande efficacité, mais j’admets qu’il s’agit de spéculation ici de ma part. Tout comme l’avis de Jean-Claude que tu reproduis reste spéculatif, car il ne connait pas la réalité des clauses du contrat signé entre les parties.
Enfin, pour ce qui concerne la position de Google sur le livre, je crois qu’il s’agit aujourd’hui (le projet initial pouvait être différent) avant tout d’éliminer toute concurrence en plaçant hors de portée le ticket d’entrée en attendant les résultats des procès en cours avec les éditeurs. La position de Google pourra évoluer à l’avenir.
Je crois surtout que maintenant, il faut arrêter de se faire peur avec des grandes envolées qui ne nous amènent pas très loin, et analyser plus finement les situations, sans prétendre avoir forcément raison dans mon analyse actuelle.
Jean-Michel> Message bien reçu. Je ne prétends pas non plus détenir la vérité en la matière. Côté « grandes envolées » (celle de Jean-Claude et probablement certaines des miennes), je reste en revanche convaincu que le risque d’eugénisme documentaire est réel même s’il n’est pas immédiat et même s’il peut encore largement être circonscrit. Sans entrer dans une analyse « fine » des situations, ma crainte est que l’on ne mesure pas suffisamment l’impact du mouvement actuel de « cloud computing » dans le domaine de l’économie de la connaissance en général et sur le circuit de distribution des industries culturelles en particulier.
Bonjour Olivier,
Autre exemple/explication de ce qui intéresse Google avec ces/ses projets de numérisation massive:
http://www.parc.com/cms/get_article.php?id=772
A propos de flux, étant donnée la longueur de vos textes et la largeur étroite du blog Typad 🙁 je lis en pleine largeur avec un lecteur RSS/atom NewsFox (plugin firefox).
il faudrait connaitre les conditions précises du contrat.
Quand on pense à la technologie simple mise en œuvre pour le scan et le nombre de gardien dans les musées qui se tournent les pouces, il y a de quoi faire ce travail colossal avec tous les fonctionnaires français qui s’ennuient au travail ou des emplois jeunes.
Est ce que l’entrée des musées nationaux français est gratuit pour les touristes ? Non c’est payant. Google va ramasser les revenus d’entrée avec la publicité sans parler des autres possibilités dérivée$.
Mon cher paul2canada,
En tant que fonctionnaire français, je n’ai pas vraiment le sentiment de me tourner les pouces et les emplois jeunes sont supprimés.Oublie les clichés, trolle un peu moins et essaye d’être clair : je ne vois pas où tu veux en venir.
Si les clauses du contrat mentionnées plus haut n’ont pas été discutées et renégociées il y a de quoi s’inquiéter. La propriété du produit de la numérisation et les droits d’exploitation sont evidemment le coeur du probleme dans le contrat. Cela équivaut à ceder les droits de distribution à Google. C’était deja le probleme en 2005, qu’avons nous fait en 3 ans??.
http://ecosphere.wordpress.com/2005/06/17/google-bnf-bibliotheque-numerique-jeanneney/
A ma chère Paulette Lhote,
Je ne permettrai pas de « troller » sur le blog d’Olivier Ertzscheid que j’estime. Mais je me réserve l’usage de l’humour.
Je suis désolé mais vous ne pourrez pas suivre cette formation de numérisation informatique réservée uniquement aux fonctionnaires qui seront volontaire pour ce travail ET qui ont une charge de travail actuelle suffisamment réduite comme les nombreux gardiens du musée du Louvre.
Emmanuel a développé mon expression « autres possibilités dérivée$ »
Bonjour Olivier, je ne comprends pas la crainte liée au mouvement de cloud computing : quel lien entre l’externalisation ‘dans les nuages’ des capacités de calcul, de bande passante ou de stockage et l’eugénisme documentaire? On peut très bien imaginer que ces capacités soient gérées par un acteur du cloud computing autre que Google, comme Amazon qui n’a pas intérêt à privatiser la connaissance, mais exclusivement à rentabiliser des coûts de structure non exploités, non?
« GoogleBooks tient également une place de choix dans l’écosystème algorithmique de la firme : la base de connaissance ainsi constituée n’est probablement pas étrangère aux remarquables capacités de traduction automatique du même Google. »
Pour l’heure, je ne suis pas du tout impressionné par les « remarquables capacités de traduction automatique » de Google.
Je les trouve même décevantes même pour les demandes de traduction où le contexte ( site Internet) est relativement précis et des copuples linguistiques (EN vers FR, ou FR vers EN) très fréquents.