Réponse à Bruno Racine (Google-BnF)

A la suite de mon dernier billet autour de Google Books ("Scanne moins fort y'a le petit qui dort"), Bruno Racine**, président de la BnF, est venu – je l'en remercie – déposer un commentaire, ci-dessous reproduit in-extenso :

**un léger doute subsiste étant donné que le commentaire a été déposé avec une adresse mail particulière et non avec une adresse institutionnelle de la BnF … mais bon on va considérer que c'est bien le vrai Bruno Racine qui est venu déposer le commentaire …

  • "Une
    précision de ma part, après la lecture de cette analyse par ailleurs
    passionnante : Jean-Noël Jeanneney n'a pas été nommé président de la
    BnF par F.Mitterrand mais par J.Chirac, une première fois en 2002 puis
    renouvelé par le même en 2005 jusqu'à son départ à la retraite; je n'ai
    pas été nommé par N.Sarkozy mais également par J.Chirac.Le débat n'est
    pas lié fondamentalement à une option politique concernant d'éventuels
    partenariats avec des entreprises privées(la BnF avait envisagé un
    accord de numérisation avec Microsoft, qui n'est pourtant pas un modèle
    du point de vue de la concurrence, du temps de JN Jeanneney) mais
    plutôt sur la stratégie de numérisation : devons-nous investir
    davantage dans les ressources rares ou précieuses auxquelles Google ne
    s'intéresse pas? dans la plus-value éditoriale plus que dans le
    processus même de numérisation? devons-nous renumériser à nos frais ce
    qui l'a déjà été? une bibliothèque numérique doit-elle être sélective
    ou avoir une visée plus exhaustive? etc. Il va de soi aussi que la
    question du respect du droit d'auteur est essentielle pour la BnF. Le
    Ministère de la Culture se préoccupe d'une législation permettant de
    numériser et de rendre accessibles les oeuvres dites orphelines et la
    BnF participe à cette réflexion très importante.
    "

Et voici ma réponse …
Je vous remercie tout d'abord de votre réactivité, ainsi que du qualificatif que vous prêtez à mon analyse. Je prends bonne note des rectifications portant sur la nomination de Mr Jeanneney et la vôtre, et vous accorde que le débat n'est pas "fondamentalement une option politique concernant d'éventuels
partenariats avec des entreprises privées
", l'exemple que vous mentionnez sur un accord de numérisation "envisagé" avec Microsoft du temps de Mr Jeanneney est en effet suffisamment éloquent. Je maintiens cependant qu'il est bien – et heureusement – question d'un pilotage politique, étant entendu que si Mr Jeanneney était resté à la tête de la BnF, il est fort improbable que d'éventuelles ou d'hypothétiques négociations avec Google aient été ne serait-ce qu'envisagées. "La face du monde …" vous connaissez la suite. Mais ceci, j'en conviens, n'est pas – loin s'en faut – l'essentiel. Permettez-moi donc de répondre brièvement aux trois points que vous mentionnez comme relevant de la seule vraie question à savoir la "stratégie de numérisation". Pardonnez naturellement la candeur de mes réponses qui ne vous apprendront probablement pas grand-chose mais qui vous sont autant destinées qu'à mes lecteurs ainsi qu'à moi-même (je ne prétend pas détenir de vérité définitive sur ce qu'il faudrait faire ou ne pas faire, je me contente d'essayer d'être un observateur attentif … et raisonnablement engagé).

  • devons-nous investir
    davantage dans les ressources rares ou précieuses auxquelles Google ne
    s'intéresse pas ?

Le problème est justement que l'on ignore quelles sont les ressources réellement disponibles dans Google. Une initiative intéressante serait celle qui permettrait à l'ensemble des bibliothèques contractantes de mettre à disposition de tous un "catalogue" de leurs oeuvres numérisées dans le cadre du volet "bibliothèques", avec naturellement un lien vers le fichier numérique, et surtout, surtout, les métadonnées idoines permettant une navigation cohérente dans le cadre d'usages d'étude ou de recherche. Je n'ai pas vérifié, mais il ne me semble pas qu'il y ait dans les contrats les liant à Google, une ligne s'opposant à ce type de transparence. Mais pour répondre plus précisément à votre question, non. Non il ne faut pas investir davantage dans les ressources rares ou précieuses auxquelles Google ne s'intéresse pas. Il faut y investir au même titre que dans les autres et dans le cadre de la politique de numérisation adaptée aux fonds possédés par chaque bibliothèque. Sauf si vous faites allusion aux incunables et autres documents menacés physiquement de destruction suite aux outrages du temps (et pour lesquels la numérisation est naturellement absolument prioritaire), sauf pour ces documents donc, ma réponse est non. Cela vous surprendra peut-être mais il me semble que le décrochage des bibliothèques (en général, pas de la BnF spécifiquement), le décrochage avec les usagers est tel, qu'il faut également proposer des versions numériques des oeuvres – classiques ou patrimoniales – les plus demandées, accédées, empruntées. Tout en continuant, dans un second temps, à numériser selon les habituelles règles d'un accès raisonné et représentatif aux savoirs et aux connaissances. Mais ne pas avoir peur d'aller chercher le public avec les oeuvres qu'il demande pour mieux ensuite pourvoir lui en conseiller d'autres. 

  • devons-nous investir
    davantage
    dans la plus-value éditoriale plus que dans le
    processus même de numérisation ?

Cela demanderait de définir précisément ce que vous entendez par "plus-value éditoriale". En supposant que vous parliez de ceci (c'est à dire des métadonnées fiables et une pluralité de formats suffisante), et étant entendu que le travail sur les métadonnées et les formats est absolument vital (cf le passage idoine dans mon billet initial), ma réponse est encore … non. Il vous faut certes continuer à investir et sur le processus de numérisation et sur sa plus-value éditoriale. Mais votre budget prioritaire doit être celui de la prescription, de la médiation, de la recommandation. Bref celui de la formation de vos personnels. Comme je tentais de l'expliquer dans mon billet, ce n'est pas la numérisation "made-in-google" qui tuera les bibliothèques. C'est l'incapacité des bibliothèques et de leurs personnels à penser de nouvelles stratégies de valorisation, d'éditorialisation des ressources numériques, de prescription réticulaire. Et soyez convaincus que je n'en veux pas aux personnels eux-mêmes, qui n'y peuvent pas grand chose et qui ont déjà suffisamment à faire. Il faut revoir de fond en comble l'ensemble de la formation aux métiers des bibliothèques. Et il faut de toute urgence former les professionnels en activité aux nouvelles et meilleurs manières de faire leur métier. Tant que je vous tiens (si vous me permettez cette familiarité), je vous soumets une idée toute simple : adosser à chaque bibliothèque ou plus exactement au réseau de bibliothèques de chaque territoire (ville, commune, intercommunalité, région) l'équivalent d'une structure de type Urfist et d'une autre de type Cléo. Je vous parie que si cela était fait, si nous ne disposions pas de 7 Urfists et d'1 Cléo mais d'une vingtaine de chacun d'entre eux, nous gagnerions à terme une dizaine d'années, non pas tant sur la question de la numérisation en tant que technique, mais sur les stratégies permettant d'optimiser les nouvelles visibilités (et les nouvelles transparences) des ressources électroniques à l'échelle de notre bel hexagone.  Ah oui et puis aussi arrêter d'être contre-productifs. Si l'on était aux Etats-Unis, si vous dirigiez la bibliothèque du congrès et si le promoteur du premier réseau social de lecteurs (par exemple LibraryThing) était venu frapper à votre porte en vous expliquant qu'il allait tout arrêter parce qu'il n'y arrivait plus tout seul et qu'il avait besoin rapidement de financements conséquents, vous n'auriez probablement pas laissé échapper une telle aubaine et vous seriez empressé de voir comment entretenir ce formidable vivier de compétences (et de clients pardon, d'usagers). Mais nous sommes en France.

  • devons-nous renumériser à nos frais ce
    qui l'a déjà été ?

Ben euh … il doit y avoir suffisamment à faire avec ce qui ne l'a pas encore été ou ce qui aurait déjà du l'être non ? … Par ailleurs vous connaissez suffisamment le coût d'une erreur, je fais ici référence au "choix" de numériser initialement les ressources de Gallica en mode image et non en mode texte, ce qui, à l'époque, était effectivement moins coûteux, mais qui, aujourd'hui, oblige la BnF à renumériser en mode texte et vous coûte au final plus de temps et d'argent que cela n'aurait dû. Bref, en terme de numérisation comme en d'autres, il est des choix politiques qui ne sont pas nécessairement les moins coûteux au moment où ils doivent être faits, mais qui se révèlent à long terme les plus profitables si on a le courage de les prendre (et les fonds qui vont avec …). Et donc j'affirme aujourd'hui que le choix politique premier pour les bibliothèques est celui de l'accompagnement de leurs personnels vers la maîtrise des problématiques et des enjeux du numérique. Et c'est aujourd'hui un choix coûteux. Mais s'il n'est pas rapidement fait on mesurera demain, hélas trop tard, à quel point il n'avait pas de prix. 

  • une bibliothèque numérique doit-elle être sélective
    ou avoir une visée plus exhaustive?

Aaaah voici une question qui ferait un excellent sujet d'examen pour les concours de catégorie A (ou B). "Une bibliothèque numérique doit-elle être sélective ou avoir une visée plus exhaustive ?" Vous avez deux heures. Oui mais … une bibliothèque numérique, c'est comme une fourmi de 18 mètres avec un chapeau sur la tête : ça n'existe pas. Il n'y a que DES bibliothèques numériques. Ceci étant dit, la bibliothèque numérique de la BnF (et des bibliothèques de portée et de taille équivalente) doit être sélective dans la diversité et exhaustive dans les collections qu'elle fera le choix de sélectionner pour être numérisées.

Une nouvelle fois merci d'être un lecteur d'Affordance (ou de suivre en cela les prescriptions de vos collègues 🙂 et en tout cas au plaisir – qui sait – d'en débattre avec vous plus longuement.

5 commentaires pour “Réponse à Bruno Racine (Google-BnF)

  1. Salut Olivier,
    Quelques nuances rapides sur tes propos et ceux de BR (ou son avatar ;-).
    Il y a bien un fort soubassement politique à cette saga, mais pas exactement où toi et lui le posez. Jeanneney est radicalement gaullien et ne s’en cache pas, Racine parait comme Sarkozy atlantiste. Cela marque fortement leur prise de positions. J’ajoute que les deux postures me paraissent aussi ringardes l’une que l’autre aujourd’hui.
    Tu sousestimes largement l’ampleur de l’effort de numérisation concernant les documents en danger. Sans que je sois spécialiste, j’imagine que cela représente, entre autres, toute la presse du 19e ou encore les archives sonores ou audiovisuelles.. de quoi occuper bien des équipes pendant longtemps.
    Une numérisation en mode texte commence par une numérisation en mode image que l’on Ocerise. Ton argument à ce sujet me parait spécieux.
    Sinon d’accord en gros sur le reste. Mais personnellement, je crois que le pb n’est pas du côté de la BnF, mais de celui de Google et pourrait se formuler ainsi : doit-on laisser une firme assumer une mission de service public sans en assumer les devoirs ? Si la réponse est non, alors il sera possible de préciser quel sera le rôle de chacun, bibliothèques et firmes privées. Mais tant que Google sera libre de sa atratégie, le jeu sera faussé et les dégats risquent d’être importants pour les institutions dont les stratégies seront tâtonnantes et sans doute vouées à l’échec et pour les citoyens qui confient leur patrimoine (informationnel et culturel) et leur liberté de lectures aux intérêts privés de quelques uns. Une comparaison facile avec les aventures récentes des banquiers montre que cela n’est pas très raisonnable.

  2. @JMSalaun > Concernant la numérisation mode texte/image, j’indiquais simplement (et je ne voie pas en quoi cela est spécieux), que la BnF avait pendant longtemps fait le choix de numériser en mode image et que l’entrée sur le “marché” et les usages de Google l’avait obligée à revenir à une numérisation en mode texte (= perte de temps et d’argent … mais surtout de temps …). L’affaire me semble avérée (de mémoire il y avait même eu à l’époque un communiqué officiel de la BnF sur le sujet).
    Quant à l’effort de numérisation pour les documents anciens, je ne le sous-estime pas. J’indiquais simplement à B. Racine que s’il y avait des choix à faire en priorité, à côté de la numérisation des documents anciens, ils me semblaient être ceux que j’indique dans le billet.
    Pour ce qui est enfin de la question des missions de service public et des devoirs associés, 200% d’accord avec toi.

  3. En tant que maître d’ouvrage de projets de numérisation, il semble que la B.N.F. ne tient pas à s’avancer dans des opérations liées à un domaine technologique qu’elle parait connaitre fort mal.
    Cet attentisme, faute d’une réflexion stratégique sur le devenir numérique des contenus d’archives, présage d’un recul, s’il est possible de faire pire encore, de la culture et de la civilisation française qui rayonnent de moins en moins dans
    « l’état d’exception culturelle » que nous subissons depuis les années 80.
    Il serait urgent que les principaux acteurs de la culture et, singulièrement ceux du livre et des archives documentaires s’associent avec des partenaires qui possèdent une expertise indubitable dans les technologies industrielles de l’information.
    Les bibliothèques et les éditeurs français ont le sentiment fallacieux de gérer des « trésors inestimables », ces contenus dont ils voudraient
    « maximiser » la valeur selon leur convenance en les diffusant en formats numériques.
    Rien n’est plus paradoxale que cette attitude ambivalente.
    Pour les gestionnaires d’archives publiques qui possèdent effectivement des documents anciens dont l’extrême rareté en font toute la valeur, il est évident que, outre les problèmes techniques que posent leur numérisation, ces documents sont très fragiles, leur duplication entrainera inéluctablement une baisse « dramatique » de leur valeur intrinsèque.
    La copie, réalisée à grand frais, mais qu’on peut reproduire à l’infini, n’a plus de valeur en soi. D’autant plus que ces contenus très anciens sont dans le domaine public.
    Enfin, tant que ce point ne sera pas clarifié en France, car la question reste pendante, la B.N.F. refusant de répondre, qu’en est-il du régime de droit des contenu des fichiers numérisés dont les contenus sont issus de documents du domaine public?
    Il en va de même pour les éditeurs, la valeur d’un contenu baisse considérablement pour ses exemplaires numérisés.
    On connait maintenant le prix du marché d’un texte diffusé dan un format ebook : il varie entre 10 et 15 US$ (entre 6 et 10 € dans l’U.E.)
    Ce point de vue est « tragique » puisque la valeur de n’importe quel document numérique dépend de ce qu’on appelle les « métadonnées ».
    En simplifiant, on dira que ces données concernent particulièrement l’indexation et le référencement du document.
    Bref toutes les informations qui permettent de se le procurer facilement.
    Il est vraiment symptomatique qu’aucun organisme français, tant public que privé, n’ait cru bon de participer aux travaux des instances internationales qui définissent des normes industrielles de référencement pour internet .
    Ces tergiversations sont désolantes puisqu’on ramène tout à un illusoire problème de
    « possession » des contenus.
    Alors même que la propriété des métadonnées ne fait pas doute :
    elle revient de plein droit au maître d’ouvrage de la numérisation des documents.
    Cela tombe très bien puisque ces données recèlent toute la valeur qui infère de la numérisation.
    Sans elles, en effet, on ne peut pas savoir que le document « existe », serait-il la duplication numérique de la meilleure qualité d’un livre d’Heures du Moyen Âge somptueusement pourvu d’enluminures.
    D’ailleurs si Google numérise en mode texte, c’est que ce choix stratégique enrichit ses bases de données de référencement et permet à n’importe quelle requête de recherche de s’appuyer sur la totalité du contenu pour fournir la réponse adéquate.
    Ce qui prouve que le contenu n’a de sens (donc de valeur) que s’il « enrichit » les données des moteurs de recherches.
    Quand au faux problème des œuvres dites
    « orphelines », il n’y a pas pire duplicité que celle de tous les acteurs économiques et des politiciens associés qui se battent pour le partage de ces biens culturels en déshérence de propriétaire, il est pourtant très simple à résoudre :
    Le principe de l’intérêt général devrait s’imposer et ces œuvres rejoindraient « naturellement » le domaine public (de façon réversible au cas ou un ayant-droit parviendrait à faire valoir la légitimité de sa propriété sur la dite-œuvre).
    Tout autre appropriation par des acteurs publics ou privés serait purement et simplement une prise de possession immorale et dommageable au plus grand nombre.
    Au fond, le problème se réduit à l’absence obstinée de moyens financiers et d’investisseurs dans l’U.E. afin de se doter d’une économie numérique qui s’appuierait sur une véritable industrie de l’information.
    L’industrie numérique européenne, c’est la même « farce » que celle de Galileo, ce système de localisation satellitaire, l’invisible concurrent du GPS.
    Tout le monde le souhaite personne ne veut dépenser quoi que ce soit.
    Le secteur public convie avec insistance les investisseurs privées qui, en retour, sollicitent assidument … les pouvoirs publics.
    En attendant, les querelles byzantines vont bon train.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Ce site utilise Akismet pour réduire les indésirables. En savoir plus sur comment les données de vos commentaires sont utilisées.

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut