BnF, Le numérique

La numérisation à la BnF : donner accès, conserver et partager les données numérisées

22 juin 2009

Un premier billet vous a présenté les premières étapes des opérations de numérisation à la Bibliothèque nationale de France : de la sélection à la constitution et à l’identification d’un document numérique. Voici maintenant les étapes suivantes : de la mise en ligne à la préservation et au partage des données numérisées.

BNF Catalogue général, signalement d'un exemplaire numérisé

BNF Catalogue général, signalement d un exemplaire numérisé

* Mettre en ligne : un ensemble d’opérations sont nécessaires pour rendre accessibles aux internautes les documents numérisés dans les meilleures conditions : signalement de l’exemplaire « numérique » dans le catalogue général de la BnF, compression des fichiers et transformation des formats visant au meilleur compromis entre lisibilité et poids, « découpage » (tuilage) des fichiers pour les documents grand format.

Lucene, le moteur de recherche retenu par la BnF, explore les métadonnées, les tables des matières, le texte des documents « océrisés » (convertis par OCR ou reconnaissance optique de caractères) et permet d’effectuer des recherches plein texte. Dans le domaine du numérique, l’accès ne se fait plus obligatoirement de l’ensemble documentaire le plus vaste vers l’élément le plus petit, la « granularité » change : cette notion renvoie aux différents niveaux d’accès aux documents : collection, document, chapitre, article, entrée dans un dictionnaire ou encyclopédie, etc. Quant aux interfaces proposées, elles ont nécessité un travail sur le graphisme, l’ergonomie et l’accessibilité.

Bibliothèque nationale de France - Système de Préservation et d'Archivage Réparti - © BnF

Bibliothèque nationale de France - Système de Préservation et d Archivage Réparti

* Conserver : accroître sa collection numérique d’environ 100 téraoctets par an représente un véritable défi de conservation. Le Système de Préservation et d’Archivage Réparti, SPAR, projet développé par la Bibliothèque nationale de France pour relever ce défi, n’est pas qu’un simple entrepôt de données sécurisées. Il recopie les objets numériques, anticipant la perte progressive et définitive des informations stockées. Il facilitera les transformations nécessaires en cas d’obsolescence technologique des outils informatiques de restitution. Ainsi par exemple : dans quelques années, le format d’image JPEG devient-il obsolète ? SPAR transformera les images concernées dans un nouveau format plus performant…

Architecture de la Bibliothèque numérique Gallica - © BnF

Architecture de la Bibliothèque numérique Gallica - © BnF

* Partager : pour partager des données numériques, les systèmes doivent pouvoir communiquer entre eux en utilisant des formats standards : on parle d’interopérabilité. Pour permettre à ses collections numériques d’être référencées dans d’autres catalogues, mais aussi pour signaler dans la bibliothèque numérique Gallica les collections de bibliothèques partenaires, la BnF a fait le choix du protocole OAI-PMH (Open archives initiative - Protocol for metadata harvesting), protocole d’interopérabilité adopté par de nombreuses bibliothèques.

Pascale Joncour (BnF)
______

Source images : Bibliothèque nationale de France
gallica.bnf.fr
images.bnf.fr

Partager ce billet
  • TwitThis
  • Facebook
  • E-mail this story to a friend!
  • Print this article!
  • LinkedIn
Adresse du rétrolien (trackback) pour ce billet :
http://blog.bnf.fr/lecteurs/index.php/2009/06/la-numerisation-a-la-bnf-donner-acces-conserver-et-partager-les-donnees-numerisees/trackback/

 

Laissez un commentaire