BnF, Collections et patrimoine

Les Archives de l’Internet français à la BnF, de 1996 à aujourd’hui !

23 juin 2009

Quelles étaient les actualités du journal Le Monde il y a dix ans ? Les blogs existaient-ils à la fin du siècle dernier ? Quels événements ont été organisés pour le passage à l’an 2000 ? Avec plus de 13 milliards de fichiers, les Archives de l’Internet offrent au chercheur une ressource extrêmement riche pour retracer les évolutions de la société française.

Archivage de l Internet à la BnF - © David Paul Carr/BnF

Archivage de l Internet à la BnF - © David Paul Carr/BnF

Depuis le 1er août 2006, la Bibliothèque nationale de France a pour mission de collecter, conserver et communiquer les sites Internet du domaine français au titre du dépôt légal (loi 2006-961 relative au droit d’auteur et aux droits voisins dans la société de l’information). Elle a donc mis en place un système de collectes automatiques des sites à l’aide de robots “aspirateurs” qui copient pages, images, animations, fichiers audio et vidéo. Ces fichiers sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l’Internet, en cliquant de lien en lien. En parallèle, la Bibliothèque a acquis des collections historiques auprès de la fondation américaine Internet Archive, qui procède à l’archivage du Web mondial depuis 1996.

Gallica, page d accueil 2005 - © BnF

Gallica, page d accueil 2005 - © BnF

Gallica, page d accueil, 1998 - © BnF

Gallica, page d accueil 1998- © BnF

Gallica, page d accueil 2009 - © BnF

Gallica, page d accueil 2009 - © BnF

La masse d’informations disponibles sur l’Internet est telle que tous les sites et toutes les pages ne peuvent être archivés. La BnF a choisi de constituer des échantillons représentatifs de l’Internet français : une large partie est issue d’instantanés annuels de la Toile, une autre provient de sélections réalisées par les bibliothécaires de la BnF. Les archives réunissent ainsi à la fois un matériau brut et des corpus spécialisés (littérature française, presse en ligne, sites gouvernementaux, développement durable, Web militant, vidéos personnelles en ligne). Voir par exemple les deux billets déjà publiés ici et sur les journaux personnels et littéraires.
Reproduites en imagettes, retrouvez les archives du site gallica.bnf.fr “photographié” en 1998, 2005 et 2009.

BnF, point d’entrée vers les Archives de l Internet © Nicolas Taffin/BnF

BnF, point d’entrée vers les Archives de l Internet © Nicolas Taffin/BnF

Les Archives de l’Internet peuvent être consultées en bibliothèque de recherche sur tous les sites de la BnF. N’hésitez pas à laisser des commentaires à la suite de ce billet. Vous pouvez également envoyer un message à la boîte électronique archivesinternet (at) bnf.fr

Pour en savoir plus :
L’archivage du Web, un défi pour les décideurs et les bibliothécaires (vidéo)
Le dépôt légal de l’Internet en pratique, Bulletin des bibliothèques de France, 2008, t. 53, n° 6.

Annick Lorthios (BnF)

Partager ce billet
  • TwitThis
  • Facebook
  • E-mail this story to a friend!
  • Print this article!
  • LinkedIn
Adresse du rétrolien (trackback) pour ce billet :
http://blog.bnf.fr/lecteurs/index.php/2009/06/les-archives-de-l-internet-francais-a-la-bnf-de-1996-a-aujourd-hui/trackback/

Commentaires (2)

  1. Le site Archive.org propose le wayback machine qui indexe 150 milliards de pages web consultables en ligne ici : http://www.archive.org/web/web.php

  2. En effet, Internet Archive collecte les sites Internet du monde entier depuis 1996. Ces archives sont destinées aux chercheurs et universitaires comme au grand public et sont disponibles librement. Cependant, seul un petit échantillon de sites français peut y être consulté.
    La BnF collecte les sites français plus largement, plus profondément et plus régulièrement. Le cadre du dépôt légal appliqué en France implique que ces archives soient consultables uniquement dans les salles de lecture de la BnF, comme pour les collections de livres ou de périodiques.

 

Laissez un commentaire