Collections, La BnF
Les Archives de l’Internet français à la BnF, de 1996 à aujourd’hui !
Quelles étaient les actualités du journal Le Monde il y a dix ans ? Les blogs existaient-ils à la fin du siècle dernier ? Quels événements ont été organisés pour le passage à l’an 2000 ? Avec plus de 13 milliards de fichiers, les Archives de l’Internet offrent au chercheur une ressource extrêmement riche pour retracer les évolutions de la société française.
Depuis le 1er août 2006, la Bibliothèque nationale de France a pour mission de collecter, conserver et communiquer les sites Internet du domaine français au titre du dépôt légal (loi 2006-961 relative au droit d’auteur et aux droits voisins dans la société de l’information). Elle a donc mis en place un système de collectes automatiques des sites à l’aide de robots “aspirateurs” qui copient pages, images, animations, fichiers audio et vidéo. Ces fichiers sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l’Internet, en cliquant de lien en lien. En parallèle, la Bibliothèque a acquis des collections historiques auprès de la fondation américaine Internet Archive, qui procède à l’archivage du Web mondial depuis 1996.
La masse d’informations disponibles sur l’Internet est telle que tous les sites et toutes les pages ne peuvent être archivés. La BnF a choisi de constituer des échantillons représentatifs de l’Internet français : une large partie est issue d’instantanés annuels de la Toile, une autre provient de sélections réalisées par les bibliothécaires de la BnF. Les archives réunissent ainsi à la fois un matériau brut et des corpus spécialisés (littérature française, presse en ligne, sites gouvernementaux, développement durable, Web militant, vidéos personnelles en ligne). Voir par exemple les deux billets déjà publiés ici et là sur les journaux personnels et littéraires.
Reproduites en imagettes, retrouvez les archives du site gallica.bnf.fr “photographié” en 1998, 2005 et 2009.
Les Archives de l’Internet peuvent être consultées en bibliothèque de recherche sur tous les sites de la BnF. N’hésitez pas à laisser des commentaires à la suite de ce billet. Vous pouvez également envoyer un message à la boîte électronique archivesinternet (at) bnf.fr
Pour en savoir plus :
L’archivage du Web, un défi pour les décideurs et les bibliothécaires (vidéo)
Le dépôt légal de l’Internet en pratique, Bulletin des bibliothèques de France, 2008, t. 53, n° 6.
Annick Lorthios (BnF)
http://blog.bnf.fr/lecteurs/index.php/2009/06/23/les-archives-de-l-internet-francais-a-la-bnf-de-1996-a-aujourd-hui/trackback/
Commentaires (2)





















mediamus
29 juin 2009 à 9:56Le site Archive.org propose le wayback machine qui indexe 150 milliards de pages web consultables en ligne ici : http://www.archive.org/web/web.php
Annick Lorthios
29 juin 2009 à 15:20En effet, Internet Archive collecte les sites Internet du monde entier depuis 1996. Ces archives sont destinées aux chercheurs et universitaires comme au grand public et sont disponibles librement. Cependant, seul un petit échantillon de sites français peut y être consulté.
La BnF collecte les sites français plus largement, plus profondément et plus régulièrement. Le cadre du dépôt légal appliqué en France implique que ces archives soient consultables uniquement dans les salles de lecture de la BnF, comme pour les collections de livres ou de périodiques.