Signalement dans Calames du corpus sous licence nationale « Archives du Parlement britannique » : Conception et sources pour la description du corpus (1/2)

Print Friendly, PDF & Email

Dans le cadre du programme d’acquisitions de ressources numériques sous licence nationale porté par le GIS CollEx-Persée, l’Abes a acquis le corpus des archives du Parlement britannique au XIXe siècle numérisées par ProQuest et choisi d’en assurer le signalement dans Calames

Des choix nécessaires pour une première

Le signalement dans Calames d’un corpus d’archives numérisées a posé des questions inédites, aussi bien d’un point de vue intellectuel que technique.

Il était en effet nécessaire de réfléchir au signalement en EAD d’archives numérisées, pour ce corpus mais également pour les suivants qui ne manqueront pas de se profiler, qu’il s’agisse de corpus acquis dans le même cadre ou de besoins spécifiques de la part d’établissements du réseau Calames, notamment dans le cadre de la collecte d’archives de projets de recherche, désormais objets de signalement.

Il a été décidé de décrire les archives dans leur version numérique, le fonds physique originel n’étant décrit qu’à un niveau élevé et général. Les données descriptives des archives originales se trouvent ainsi dans le fichier maître, plus haut niveau d’une arborescence EAD dans Calames, à titre d’informations générales pour contextualiser le corpus. Pour leur part, les niveaux inférieurs décrivent les archives numérisées.

La construction de l’arborescence a, quant à elle, été pensée selon les règles incontournables de l’archivistique, par série et sous-série d’archives, puis chronologiquement à l’intérieur de chaque sous-série :

Au niveau des composants, deux principes ont été mis en œuvre. D’une part, par commodité, et afin d’appliquer un classement aussi logique et simple que possible au sein de l’arborescence,  un composant EAD correspond à chacun des documents. Ainsi, pas de découpage d’un document en plusieurs composants, ni de regroupement de plusieurs documents dans un même composant.

D’autre part, afin d’appliquer au classement des documents un ordre chronologique à la fois strict et clair, les composants décrivant les documents sont regroupés par « session parlementaire » sous des composants de premier niveau, correspondant chacun à une session parlementaire.

On peut voir ci-dessous le résultat obtenu par l’application de ces deux principes :

Des métadonnées fournies dans trois formats

Parallèlement à la définition des besoins pour la description en EAD, l’équipe a mené une analyse des données descriptives du corpus livrées par ProQuest, éditeur de la base d’archives numérisées. Cette livraison a été effectuée en trois formats :

  • de l’XML
  • du MARC
  • un tableau Excel, servant de preuve juridique de l’exactitude de la livraison et contenant également certaines informations précieuses, non présentes dans les autres formats ou plus facilement réutilisables que dans les autres formats.

Relativement plus pauvre que le MARC, l’XML a été essentiellement utilisé pour prélever les données d’indexation originelles du corpus : une première indexation, qu’il était logique de conserver pour la convertir en EAD, avait en effet été réalisée dans les années 1980 par des chercheurs britanniques. Le format MARC a fourni l’essentiel des données utilisées pour la conversion en EAD, complété par le tableau Excel. Dans ces données tabulées se trouvaient notamment le nombre de pages de chaque document qui ne figurait pas dans les données en MARC.

Dernière source utilisée – non livrée par ProQuest mais produite par l’Abes – pour extraire les données à convertir en EAD,  un tableau Excel contenant les 5 500 formes d’indexation anglaise les plus courantes du corpus, traduites en RAMEAU. Pour le résultat final, puisque l’usage de termes RAMEAU est fortement recommandé pour tout signalement dans Calames, il est en effet apparu naturel de conserver l’indexation originelle anglaise tout en proposant également une version traduite.

Étienne Naddeo, responsable Calames

Voir aussi  :

https://fil.abes.fr/2022/10/24/les-archives-du-parlement-britannique-dans-calames-une-premiere-et-des-perspectives

https://publications-prairial.fr/arabesques/index.php?id=2790

 

 

 

 

 

La publication a un commentaire

  1. Je reste un peu dubitative du choix de publier la numérisation d’une édition d’archives dans CALAMES, mais suis admirative du résultat de la récupération des données par l’ABES. On arrive à un résultat d’une bonne richesse descriptive, et d’une clarté de présentation qui n’aurait sans doute eu aucun équivalent en MARC. Bravo pour cette conversion enrichie.

Laisser un commentaire

Tweetez
Partagez
Partagez
Aller au contenu principal