J'ai donc lu en intégralité le rapport Tessier sur la numérisation du patrimoine écrit (en version pdf). Rappelons-le, ledit rapport était censé apporter des éléments circonstanciés de réponse à la question : la BnF doit-elle signer avec Google ? La réponse est un "Oui mais".
En guise de préalable je voudrais adresser les plus chaleureuses félicitations à mes étudiants de deuxième année Métiers du livre de l'IUT de la Roche sur Yon, lesquels, deux jours avant la remise du rapport, avaient dans leurs copies d'examen, listés au moins deux des préconisations essentielles de la commission Tessier : le troc "un livre pour un livre" (p.31) et l'affichage de la provenance du fichier sur le site consulté (p.32). Bravo à eux. Si Frédéric Mitterand cherche à recruter pour sa prochaine commission, qu'il n'hésite pas à les contacter 🙂
Allons-y donc pour mes remarques et notes de lectures.
Les 4 pistes principales suggérées par le rapport sont les suivantes (p.3) :
- "changement d'échelle de la numérisation" : of course. Je voie mal comment l'on pourrait être contre …
- "changement du mode de fonctionnement de Gallica" : j'y reviendrai en détail ci-après mais j'indique tout de suite que la manière dont Marc Tessier envisage ce changement me semble être l'archétype même de la fausse bonne idée.
- "partenariat avec Google Livres par échange de fichiers numérisés sans exclusivité sur les fichiers échangés" : j'y croie dur comme fer (même si je sais – n'est-ce pas Calimaq 😉 ?) que les millions d'euros du plan de relance affectés à la numérisation pourraient permettre d'offrir une alternative. Je reste cependant convaincu qu'atteindre une masse critique full-text francophone me semble une urgence et un préalable. Et que les modalités décrites de l'échange de fichier me semblent être l'une des bonnes approches possibles.
- "relance d'une impulsion européenne" : pourquoi pas. Cela ne coûte en tout cas rien de l'affirmer. Mais à lire la suite du rapport Tessier, on s'aperçoit très vite du peu de crédit que la commission Tessier accorde à sa propre proposition …
La première partie (Etat des lieux – p.4 à 14) est – très – bien faite. Elle n'apprendra
rien à ceux qui suivent l'affaire, mais elle constitue une très bonne
synthèse du sujet et des acteurs qui gravitent autour. J'ai notamment apprécié à sa juste mesure la petite touche d'humour de la page 10, à propos de la clôture du projet d'accord transactionnel de classe (class action settlement) :
- "une vaste campagne de publicité a alors été entreprise dans le monde entier pour signifier aux auteurs et aux éditeurs qu'un document de plus de 300 pages rédigé en anglais juridique, était sur le point de modifier leurs droits sur leurs propres livres."
En outre j'ai – quand même – appris – ou eu confirmation – d'un certain nombre de choses importantes pour la suite de l'affaire :
- p.12 : "le ministère de la culture s'engage en 2010 dans la mise en place d'un système permettant la gestion collective des oeuvres orphelines, au moins dans le domaine de l'imprimé et de l'image fixe." On sait pas encore à quoi cela ressemblera législativement, mais on a confirmation qu'ils étudient le problème … plus loin p.25 : "le 30 septembre 2009, le ministère de la culture a chargé ses services de proposer une suite législative à cette recommandation." Wait and see …
La seconde partie ("Les accords actuels avec Google : une réponse inadaptée" p.15 à 20) démarre mal.
Le rapport relève qu'en matière de patrimoine numérisé les missions des bibliothèques publiques sont de deux ordres : "assurer la pérennité (…) et favoriser l'accès le plus large possible". Il en oublie une troisième à mon avis essentielle : la représentativité du patrimoine numérisé.
L'accord Google-BnF était déjà dans les tuyaux à l'été 2009. A la page 15, on apprend l'existence d'un projet d'accord (baptisé "memorandum of understanding") entre Google et la BnF. Confirmation donc même si l'on pouvait naturellement en subodorer l'existence. Demi-surprise page 18 en apprenant "l'intérêt de Google pour ces
métadonnées d'autorité (la base RAMEAU de la BnF) dans le projet de
protocole d'accord envisagé avec la BnF à l'été 2009." J'avoue que
l'efficace embrouillaminis de RAMEAU cadre assez mal avec l'approche
minimaliste des métadonnées chez Google. A mon avis ils (Google) ont surtout dit ça pour flatter l'ego-métier de la BnF ;-)) Plus sérieusement (et toujours p.18), dans cette première version non-aboutie préparatoire de l'accord "une clause spécifique prévoyait que la société Google reverse à la bibliothèque les fichiers d'oeuvres francophones du domaine public numérisées à partir des fonds d'autres signataires". Je ne peux que réaffirmer tout l'intérêt de cette idée, surtout si d'autres bibliothèques – nationales ou non – pouvaient bénéficier à leur tour d'une telle réciprocité.
Page 15 toujours, le rapport rappelle bien que dans les accords actuels passés entre Google et des bibliothèques, outre la clause d'exclusivité commerciale, c'est la question de la stérilisation de la copie remise aux bibliothèques (et la durée excessive et léonine de l'embargo sur icelle) qui pose problème : les accords (dont celui de Lyon) "indiquent seulement la transmission du fichier texte brut (texte non-structuré), sans aucun engagement sur la nature de l'océrisation et les traitements effectués ; il n'est donc pas évident que la bibliothèque puisse ensuite faire les liens nécessaires entre image et texte." Ben oui. D'aucun s'alarmaient il y a longtemps déjà (Août 2006) d'un risque d'eugénisme documentaire. Rappelons que la bibliothèque ne peut ensuite, pendant la durée de l'embargo, que proposer les fichiers images et non les fichiers textes à son propre public. Autres points importants déjà connus et débattus mais bien relevés par le rapport (p.16) :
- l'interdiction (pour les bib) du "systematic downloading"
- l'impossibilité pour les autres moteurs (et parfois aussi d'autres partenaires publics) de venir indexer et référencer les documents numérisés.
Et page 19, une surprise de taille. On sait que Google (y compris en l'occurence Google Books) prête aisément le flanc à des attaques pour abus de position dominante. Et là le rapport Tessier nous sort ce qui ressemble à première vue à une "botte de Nevers" mais qui me semble surtout être un gigantesque coup d'épée dans l'eau : il s'agit de la notion de "facilité essentielle".
- "cette notion, issue du droit de la concurrence, est souvent employée dans le domaine des réseaux (chemin de fer, télécommunications, transport d'électricité). Les caractéristiques d'une facilité essentielle sont les suivantes : elle n'est pas interchangeable ou substituable ; le coût de mise en place d'une infrastrucure équivalente serait prohibitif, en termes de temps et/ou d'argent. L'accès à cette facilité est donc indispensable pour les opérateurs du secteur (…)."
J'arrête là. Vous avez compris l'idée : si la numérisation d'oeuvres du domaine public est une "facilité essentielle", alors Google pourrait être sommé (droit de la concurrence) de partager le gâteau avec tous ceux (opérateurs publics ou privés) qui le souhaitent. Voilà qui est à mon avis bien excessivement capillo-tracté mais bon en même temps je ne suis pas juriste, j'attendrai donc de lire des critiques plus qualifiées que la mienne sur ce point.
Et voici donc la troisième partie du rapport ("Les solutions possibles", p.21 à 37). Et soudain, c'est le drame.
Voici ce que l'on peut lire page 21 :
- "Le premier objectif est d’éviter le risque d’une segmentation du patrimoine, en se donnant l’ambition d’une numérisation exhaustive, ou en tout cas la plus large possible, des ouvrages libres de droits et sous droits." Là je dis OK.
- "Le débat entre numérisation sélective ou numérisation de masse a en effet été tranché par les usages observés, qui témoignent de la confiance des internautes dans la « neutralité » des moteurs de recherche et de la capacité des acteurs culturels à proposer progressivement leurs contenus sur le web." Là je dis ah ben oui effectivement les internautes croient à la neutralité des moteurs de recherche, mais euh … comment dire … faut quand même être affligé d'une cécité flagrante pour ne pas voir que ladite neutralité est tout sauf une certitude, et tout sauf une garantie à moyen ou long terme (l'actualité récente de l'implantation de Google en Chine n'en est que l'un des innombrables exemples …). Quant au débat supposémment tranché entre numérisation sélective ou numérisation de masse, si c'est la seule croyance en une neutralité des moteurs qui a permis de le faire, c'est franchement inquiétant …
- "Une large partie des requêtes repose sur l’interrogation de bases larges par un moteur simple à utiliser. La grande majorité des internautes, notamment le grand public, n’attend pas véritablement une « éditorialisation des archives » ; elle veut trouver ce qui l’intéresse. Si l’usage simple du moteur de recherche peut ensuite être combiné avec d’autres modes d’accès, plus structurés, il n’en reste pas moins que l’usage dominant aujourd’hui est celui de l’interrogation via une requête simple, fondée sur un ou quelques mots-clés. Une numérisation exhaustive est donc bien un des objectifs à rechercher, en sus des structurations documentaires pour des publics plus spécialisés par les institutions publiques." Je répète : "La grande majorité des internautes, notamment le grand public, n’attend pas véritablement une « éditorialisation des archives »". Et là je dis à Marc, attention Marc, faut quand même faire un peu gaffe à ce que tu affirmes sans ciller. D'abord (c'est mon côté prof), j'aimerais bien que tu fasses l'effort de citer les sources qui te permettent d'affirmer de telles énormités. Ensuite, pour "trouver ce qui l'intéresse", et ben figure-toi que "la grande majorité des internautes" va … sur Google Livres. Et que si on relègue au second plan tout notion d'éditorialisation, autant tirer tout de suite un trait sur la notion même de bibliothèque. Fabriquons un entrepôt avec des métadonnées minimales et basta. Mais un entrepôt de numérisation de masse n'est pas et ne sera jamais une bibliothèque. Par ailleurs, renoncer à l'éditorialisation implique également, en termes de compétences-métier, de renoncer à la prescription, au conseil, à la recommandation … bref de renoncer à la seule compétence propre qui reste encore indubitablement et pour longtemps du ressort des métiers du livre et des bibliothèques.
Tout ceci est d'autant plus étonnant que c'est en contradiction flagrante avec ce qui est raconté à la page suivante du rapport (p.22) :
- "il conviendra donc de veiller à ne pas numériser pour numériser, mais d'assurer l'accès à ces fonds numérisés, ce qui implique de réfléchir très en amont à la façon dont les documents pourront être trouvés, c'est à dire visibles, sur l'internet." Et de citer pêle-mêle, outre le référencement et l'indexation, les "citations dans des blogs ou des sites communautaires". Si je peux me permettre Marc, y'a peut-être un truc qui t'as échappé. C'est précisément ce que tu appelles l'éditorialisation, c'est à dire – en fait – la capacité à exercer une compétence de filtrage et de sélection, qui permet d'amorcer le long (et ô combien incertain) cycle de l'effet de buzz (blogs et sites communautaires). Par ailleurs, c'est pas pour être sarcastique, mais je te rappelle également que le seul site massivement communautaire francophone sur le livre a très récemment fermé faut d'intérêt de la part des pouvoirs publics. Tu n'y es certes pas pour grand chose, mais c'eût peut-être été opportun de le rappeler dans ton rapport …
Et puis il y a l'erreur. Lourde. Massive. Tellement française. Tellement jacobine. Celle que l'on nous ressert à chaque nouvelle commission, à chaque dîner en ville, à chaque nouvel "état général" ou autre "table-ronde prospective". L'erreur de vouloir transformer Gallica en une sorte d'agence de moyens chargée de tout numériser pour tout le monde (éventuellement en la retirant de la tutelle de la BnF (p.27 il propose de la transformer en GIP) – ce que F. Mitterand a pour l'instant refusé), numériser les oeuvres libres de droit, orphelines, sous droits, numériser pour les bibliothèques mais aussi, allons-y donc, pour les éditeurs, et tant qu'à faire lui permettre – si les éditeurs le souhaitent – d'y vendre directement les ouvrages ou de renvoyer vers des sites tiers. Bref, l'erreur – fatale – du portail interprofessionnel, le syndrôme de l'usine à gaz.
Et alors là je dis STOP !! Il n'est qu'à se rappeler tout la difficulté qu'un syndicat (celui des libraires) a eu pour monter un portail professionnel (et pas inter-professionnel), le temps que cela a pris pour finalement n'aboutir à rien, il n'est qu'à voir la position de rentiers sur la défensive qu'adoptent les éditeurs (notamment par la voix de leur syndicat représentatif – SNE) dès qu'on leur parle de mutualisation ou de capitalistion répartie, il n'est qu'à observer l'état plus qu'embryonnaire du marché et du modèle économique du livre numérique pour se rendre compte, non seulement du caractère irréalisable de cette proposition, mais pour également mesurer le temps (l'argent et l'énergie) que le simple déclenchement de sa mise en oeuvre ferait perdre à l'ensemble des acteurs du secteur (libraires, éditeurs et bibliothécaires). D'autre part, affranchir Gallica de la BnF c'est la couper, sine die, de toute sa légitimité et surtout de tout son intérêt. Il faut arrêter de tout mélanger, sauf à vouloir continuer à ne rien faire que de s'interroger sur les degrés de solubilités respectifs des métiers de l'édition, de la librairie et des bibliothèques. Sauf à vivre au pays de Oui-Oui et à occulter (ou à méconnaître) délibéremment les spécificités de chaque métier, et le lobbying qui y est attaché. Et ce n'est certainement pas la maigre carotte non-chiffrée proposée par le rapport Tessier (p. 25 : "l'accès au financement public pour la numérisation des livres devrait être subordonné à l'adhésion à Gallica") qui permettra de changer cet état de fait.
Erreur suivante. Celle commise à propos des oeuvres orphelines. Le rapport préconise que :
- "Gallica sera naturellement appelée à jouer un rôle deplate-forme de diffusion et de valorisation des oeuvres orphelines, à partir du moment où le code de la propriété intellectuelle permettra les utilisations numériques de ces documents. (…) il apparaît donc extrêmement souhaitable que les éditeurs soient associés au pilotage même de Gallica." (p.25)
Nouvelle erreur parce que nouvelle usine à gaz en perspective et nouveaux blocages économiques et culturels assurés. Le seul moyen d'en sortir, la seule solution (à mon avis naturellement), c'est de légiférer au niveau national (et si possible international) sur une procédure d'opt-out généralisée concernant les oeuvres orphelines. Tout le reste n'est qu'atermoiement contre-productif et allant à rebours des usages du web tout autant que de l'évolution des métiers du livre.
Heureusement il y a quand même LA bonne idée. C'est à lire page 31 et s'intitule "Un livre pour un livre : une proposition de partenariat fondée sur l'échange de fichiers numérisés". Du troc. C'est le premier point que j'évoquais au tout début de ce billet donc je n'y reviens pas. Sauf pour signaler qu'il existe quand même un blocage majeur : cela obligerait Google à revoir l'ensemble des contrats déjà établis avec d'autres bibliothèques, pour pouvoir reverser à la BnF leurs – ceux de Google ou des bibliothèques – exemplaires numérisés ("de qualité équivalente et de formats compatibles"). Je signale également à Marc Tessier l'existence d'un groupement de doux dingues, baptisé Hathi Trust, qui pourrait probablement être assez séduit par cette idée, puisqu'ils ont eu à peu près exactement la même, mais ont décidé de l'exercer sur des modalités différentes ;-).
Auussitôt contre-balancée par une "proposition alternative" stupéfiante de naïveté (p.32) : Comme emporté par son précédent élan de jacobinisme de bon aloi (mais de
mauvaise augure), le rapport Tessier se met à carrément envisager (p.32) la création "d'une filière de numérisation partagée – une sorte de joint-venture – qui permettrait à Google et à la bibliothèque de réaliser leurs opérations de numérisation au même moment, chacun selon leur procédé, mais en partageant les équipes et en ne mobilisant qu'une seule fois les ouvrages à numériser." Euuuuuuh … Soit le rédacteur de ce passage avait abusé de substances psychotropes, soit il méconnaît à la fois les règles des brevets d'innovation détenus par Google (sur la numérisation et l'océrisation), ainsi que celles du simple secret industriel. Sinon, il peut aussi proposer à deux constructeurs automobiles d'installer leur chaîne de conception et d'assemblage dans une seule et même usine et de faire tourner leurs équipes … Enfin il peut essayer …
Et puis il y a l'Europe et la "mutualisation". Passages obligés de ce genre d'exercice. Tout rapport à destination ministérielle se doit d'évoquer une ambition européenne en faisant référence à une nécessaire mais encore insuffisante mutualisation des compétences. Le rapport Tessier ne déroge pas à cette règle. C'est à lire en pages 43 à 36. Mais cela aurait tout aussi bien pu figurer en Annexe … on compte sur les doigts de la main d'un pingouin les ardents défenseurs d'Europeana comme portail sinon durable du moins simplement crédible.
Mais aussi …
Le raport Tessier veut faire du social. Plus exactement il veut ajouter des fonctionnalités sociales dans Gallica. P.28 : "de nouvelles fonctionnalités, davantage orientées vers les aspects participatifs et communautaires." C'est dans le vent, et ça ne coûte pas beaucoup d'argent. C'eût donc été dommage de se priver d'une telle recommandation. Avec une erreur de jugement cependant puisqu'on peut lire page 29 : "Si les tentatives d'organisation des communautés de la Toile par des institutions sont souvent vouées à l'échec". Cette dernière phrase est vraie. L'erreur provient de l'angle de l'analyse. Quand des institutions utilisent les réseaux communautaires pour y déporter tout ou partie de leurs collections, c'est le buzz assuré (cf la LoC sur Flickr et plus globalement l'initiative FlickR Commons, d'ailleurs – et c'est dommage – absente du rapport Tessier).
Le grand perdant du rapport Tessier se nomme Patrick Bazin, allègrement dézingué à la fois par le rapport Tessier (p. 18 : "l'autonomie de Lyon ne sera acquise qu'à l'issue de la période d'exclusivité de 25 ans préue par l'accord") et par le ministre de la culture ("C'est une erreur, on ne peut rien y faire, ce n'est pas du ressort du ministère de la culture et de la communication.")
Voilà. Le rapport Tessier n'a rien changé à ma position initiale.
Son principal intérêt ? Celui de l'idée d'un troc (compliqué mais possible) permettant d'atteindre très rapidement une masse critique considérable d'ouvrages numérisés francophones du domaine public.
Ses principaux défauts ? Trois.
- Le traitement erroné ("joint-venture" …) et insuffisant de l'impérieuse nécessité de déployer une infrastructure de numérisation nationale mutualisable et capable d'absorber les numérisations déjà réalisées par toutes les bibliothèques publiques.
- Le dangereux mélange des genres autour d'un impossible portail interprofessionnel à la fois public et marchand.
- L'erreur de positionnement concernant l'utilité de toute éditorialisation.
Mais bon, je dois pas être le seul à l'avoir lu ce rapport hein ? Ni à avoir un avis dessus ? 🙂
<Update du lendemain> Le réseau des bibliothèques publiques n'est pas le seul oublié du rapport Tessier. Comme l'atteste le communiqué ci-dessous 🙂
- "Le 13 janvier 2010 – Communiqué de l'Association des archivistes français. Pas de révolution numérique sans les Archives
- L'Association des Archivistes français note qu'à l'occasion de la
remise du rapport Tessier sur la numérisation au ministre de la
Culture, celui-ci préconise dans le journal Le Monde daté du 12 janvier
de mettre à la disposition de quatre établissements publics (Réunion
des Musées nationaux, INA, Centre national de la Cinématographie, BnF)
750 millions d'euros issus du grand emprunt pour développer des projets
en matière de numérisation. L'AAF déplore que M. Mitterrand, ministre de tutelle des archives, ait
oublié qu'il exerce cette responsabilité, et méconnaisse leur rôle déjà
ancien et leur expertise dans la numérisation du patrimoine, tant au
niveau national que local, pour répondre aux demandes et aux nouvelles
habitudes de travail des usagers. Rappelons que les projets de
numérisation du patrimoine culturel conduits en France ces 10 dernières
années concernent principalement les services d'archives, qui ont
fourni au moins 50 % de l'ensemble des collections actuellement
numérisées. Les professionnels des archives feraient ainsi leur profit,
pour mener des projets de numérisation visant tant à la diffusion qu'à
la valorisation, ou servant des projets éducatifs, de cette «formidable
manne» ainsi que la qualifie le ministre. L'AAF espère que ces préconisations seront reconsidérées pour inclure
les Archives nationales dans les bénéficiaires de ce budget."
</Update>
Pas d’accord sur l’équité du troc, je ne vois pas l’intérêt de la BnF dans cet échange de fichiers. Gallica peut parfaitement signaler les titres en français numérisés par google et permettre le feuilletage sur son site, sans pour autant posséder ces fichiers. Le programme Google Recherche de livres permet depuis longtemps à des sites tiers d’intégrer gratuitement les livres numérisés par Google. Demandons plutôt à Google livres de signaler les collections qu’il n’a pas lui-même numérisé (c’est apparemment prévu pour 2010), google renverra les visiteurs sur gallica pour l’accès à la version intégrale et tout le monde sera content!
@guillaume : J’ai tendance à être sensible à ces arguments ! Avez vous une source à citer quand vous dites à propose de votre affirmation : « Demandons plutôt à Google livres de signaler les collections qu’il n’a pas lui-même numérisé (c’est apparemment prévu pour 2010) »
Sinon merci à Olivier pour ce point de vue tranché et fin, comme d’habitude. Finalement, tu préconises un entrepôt mutualisé sur le modèle d’Hathi trust (donc mutualisation public/public en terme d’infrastructure), et tu sembles considérer que « mettre du social » dans Gallica est voué à l’échec pour aller plutôt vers une dissémination des données dans les réseaux sociaux (flickr commons) : Rémis Mathis a une position proche en évoquant un partenariat Bnf/wikimédia. C’est un modèle que les allemands expérimentent : http://www.bibliobsession.net/2009/02/25/comment-wikipedia-permet-dameliorer-le-fichier-des-autorites-nom-dauteurs-de-la-bn-allemande/
Il me semble pourtant incomplet de considerer (pas toi, mais en général) que google livres est une sorte d’entrepôt de fichiers, alors qu’il propose déjà de nombreuses « fonctionnalités sociales » (ma bibliothèque, avis, critiques, accès au document) et que demain google livres n’aurait pas grand chose à faire pour devenir un librarything très puissant… Alors mutualiser sur des infrastructures oui, et refuser les exclusivités de google sur l’indexation des fichiers oui et j’ai tendance à croire qu’un des principaux réseau social sur lequel les bibliothécaires devront exercer des compétences de médiation et de recommandation (dans les meilleurs des cas) sera… google livres non (ou facebook) ?
@bibliobsession: j’avais lu ça ici: http://tinyurl.com/yctl7qm, ça vient de Brandon Badger, chef de produit Google livres: « Google does not require exclusive contracts, and the company will be willing to promote other e-books from third parties on the site as well ».